Допомога у написанні освітніх робіт...
Допоможемо швидко та з гарантією якості!

Технология пошуку документальної інформацією Интернет

РефератДопомога в написанніДізнатися вартістьмоєї роботи

Агенти — самі «інтелектуальні» з пошукових коштів. Вони можуть робити більше, ніж просто шукати: можуть виконувати навіть транзакції від Вашого імені. Вже зараз вона можуть шукати cайты специфічної тематики і повертати списки cайтов, відсортованих з їхньої відвідуваності. Агенти можуть обробляти зміст документів, знаходити і індексувати решта видів ресурсів, як сторінки. Вони можуть також бути… Читати ще >

Технология пошуку документальної інформацією Интернет (реферат, курсова, диплом, контрольна)

Міністерство загального характеру і професійної освіти РФ.

ДЕРЖАВНИЙ УНІВЕРСИТЕТ УПРАВЛЕНИЯ.

Інститут заочного обучения.

КУРСОВОЙ ПРОЕКТ.

По дисципліни: «Інформаційні технології в управлении».

На тему: «Технології пошуку документальної інформацією INTERNET».

Выполнено: Єгорова А.С.

Студенческий квиток № 3065.

Группа 431.

МОСКВА, 2001.

ЗМІСТ (стр.):

1.

ВВЕДЕНИЕ

.

1.1. Що таке Internet (3).

1.2. Коротка історія Internet (5).

2. БРАУЗЕРИ: порівняльні характеристики Netscape Navigator і Microsoft Internet Explorer (6).

3. ПОШУКОВІ СИСТЕМИ (10).

3.1. Механізми пошуку (12).

3.2. Порівняльний огляд пошукових систем. Структура запиту (15).

4. ВИСНОВОК (24).

5. СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ (25).

1.

ВВЕДЕНИЕ

.

1.1. Що таке Internet.

Internet — глобальна комп’ютерна мережу, що охоплює увесь світ. Сьогодні Internet має близько тридцяти мільйонів абонентів у понад 180 країнах світу. Щомісяця розмір мережі поповнюється 5−7%. Internet утворює як б ядро, що забезпечує зв’язок різних інформаційних мереж, що належать різноманітних установ в усьому світі, одна з другой.

Сплеск інтересу до глобальної інформаційної мережі Internet простежується сьогодні повсюдно. За таких умов потреба у інформації про мережі Internet стає особливо гострої. Нині по Internet поширюється чимало документів, що стосуються як функціонування сіті й роботи у ній користувачів, і що з різними сферами життя: наукою, культурою, економікою й участі т.д. При що ж відновлення інформацією Internet, великої розгалуженої мережі, яка включає у собі комп’ютерні вузли, розкидані всьому світу, відбувається, практично, як реального времени.

Насправді Internet непросто мережу, — він є структура, що об'єднує звичайні мережі. Internet — це «Мережа сетей».

Щоб описати сьогоднішню Internet, корисно скористатися суворим визначенням. У книжці «The Matrix: Computer Networks and Conferencing Systems Worldwide «Джон Квотерман описує Internet як «метасеть, що складається із багатьох мереж, які працюють відповідно до протоколів сімейства TCP/IP, об'єднані через шлюзи й використовують єдине адресне простір і простір имен».

Для організації межсетевых сполук необхідний відповідний протокол.

Протокол — це набір домовленостей, що визначає обмін даними між різними програмами. Протоколи задають способи передачі повідомлень і обробки помилок у мережі, і навіть дозволяють розробляти стандарти, не прив’язані до конкретної апаратної платформі. Усі параметри — від швидкості передачі до методів адресації при транспортуванні окремих повідомлень — задаються протоколами, які у даної конкретної сети.

У Internet базовим протоколом служить TCP/IP (Transmission Control Protocol/Internet Protocol). IP відпо-відає адресацію мережевих вузлів, а TCP забезпечує доставку повідомлень по потрібному адресою. Ці потужні протоколи було запропоновано 1974 р. Робертом Кэном, однією з основних розробників ARPANET, і ученым-компьютерщиком Винтоном Серфом, віце-президентом CNRI. Слід пам’ятати, що TCP/IP єдиний протокол, придатний об'єднання різних мереж. Internet нині перетворилася на многопротокольную мережу, інтегруючу інші стандарти. Основні у тому числі - стандарти взаємодії відкритих систем (OSI).

Запропоновані Міжнародної організацією по стандартизації (ISO) протоколи OSI отримали стала вельми поширеною у Європі. Системи, засновані інших протоколах, теж підключаються до Internet через шлюзи. Наприклад, BITNET — це мережу, що використовує передачі даних свої власні стандарти, проте, по крайнього заходу, частково, її має через шлюзи з Internet.

У Internet немає єдиного пункту підписки чи реєстрацію; натомість ви контактуєте з постачальником послуг, що дає вам доступом до мережі через місцевий комп’ютер. Наслідки такої децентралізації з місця зору доступності мережевих ресурсів ще дуже значні. Середовище передачі в Internet не можна розглядати лише як павутиння дротів чи оптоволоконних ліній. Оцифровані дані пересилаються через маршрутизатори, які з'єднують сіті й з допомогою складних алгоритмів вибирають найкращі маршрути для інформаційних потоков.

1.2. Коротка історія Internet.

Спочатку ніщо не віщувало, що Internet стане загальнодоступною комп’ютерної мережею. Як і більшість інші великі ідеї, «Мережа мереж» виникла з проекту, призначеного цілком з метою. Її прародичкою стала мережу АRPANET, розроблена і розгорнута 1969 р. компанією Bolt, Beranek, and Newman (BBN) на замовлення Агентства передових дослідницьких проектів (ARPA) Міністерства оборони США.

ARPANET об'єднувала навчальними закладами, військові організації та їх підрядників. Її було створено з єдиною метою допомогти дослідникам в обміні інформацією, і навіть (що було одним із головних цілей) для відпрацювання методів підтримання зв’язку у разі ядерного нападения.

Засновники ARPANET спочатку дозволяли ученим лише ввійти у систему і запустити програму на такого далекого комп’ютері. Незабаром до цих можливостям додалися передача файлів, електронна пошта і списки розсилки, забезпечили спілкування дослідників, те що одному й тому ж областю науку й техніки. Але в міру зростання ARPANET розвивалися та інші мережі, і стало очевидним потреба у нових засобах связи.

Порівняно нещодавно з’явилася нова технологія Internet названа World Wide Web (WWW), які зазвичай перекладається «всесвітнє павутиння». Ця систему було розроблена, переважно, в Європейської лабораторії елементарних частинок у Швейцарії (CERN). Мережа призначалася спочатку для фізиків, але потім отримала широке признание.

WWW побудована за технологією, основу якої лежить принцип створення гіпертекстових документів (Web-страниц). Гіпертекстову документ укладає у собі посилання решту документи, які, своєю чергою, містять посилання такі, тощо. Отже, вони виявляються пов’язаними між собой.

Робота в WWW використовується протокол HTTP (Hyper Text Transmission Protocol), а програми, дозволяють працювати з відповідними документами в Internet, називають просмотрщиками чи браузерами.

2. БРАУЗЕРИ: порівняльні характеристики Netscape Navigator і Microsoft Internet Explorer.

Документи Internet призначені для відображення в електронному вигляді, причому автор документа не знає можливостей комп’ютера, у якому будуть проглядатися документи. Тому було створено стандарт для описи і створення документів, розташованих на Web-страницах. Її називається HTML (HyperText Markup Language — мову розмітки гіпертексту). Її описує логічний структуру документа, управляє форматуванням тексту і розміщенням вставних объектов.

Форматування і відображення документа, описаного з допомогою HTML, на конкретному комп’ютері виробляється спеціальної програмою — браузером. Інакше кажучи, браузер призначений для перегляду вмісту Web-страниц.

Основні функції браузерів следующие:

. установка через відкликання Web-сервером, у якому зберігається документ, і завантаження усіх її компонентов;

. форматування і відображення Web-страниц відповідно до можливостями комп’ютера, у якому браузер работает;

. надання коштів на відображення мультимедійних та входять до складу Web-страниц, а як і механізму розширення, що дозволяє налаштовувати програму працювати з новими типами объектов;

. забезпечення автоматизації пошуку Web-страниц спрощення доступу до сторінкам, посещавшимся раньше;

. надання доступу до вбудованим чи автономним засобам до роботи коїться з іншими службами Internet.

Нині цьому ринку домінують два браузери: Navigator фірми Netscape і Internet Explorer фірми Microsoft.

Вони надають користувачам дуже схожий інтерфейс й створили набір основних можливостей та ведуть цьому ринку дуже жорстку конкурентну боротьбу, постійно оновлюючи попередні версии.

Нижче наводиться опис основних можливостей цих браузеров.

Браузер Internet Explorer забезпечує роботи з WWW, надає ідентичні кошти роботи з локальними папками комп’ютера та файловими архівами FTP, дає доступом до засобам зв’язки Польщі з Internet. Для запуску програми можна використовувати значок Internet Explorer на Робочому столі чи Головного меню. З іншого боку, програма запускається автоматично під час спроби відкрити документ Internet чи локальний документ в форматі HTML.

Якщо з'єднання з Internet відсутня, то після запуску програми з’явитися діалогове вікно установки сполуки. При неможливості установки сполуки зберігається можливість перегляду в автономному режимі раніше завантажених Web-документов. За наявності сполуки після запуску програми на екрані з’явиться основна сторінка, обрана при настроюванні программы.

Далі можна працювати з Web-страницами, перевіряючи їхні вміст, зберігаючи його за локальному диску тощо. У цьому можна відкривати кілька вікон, працюючи з кількома Web-страницами.

Для ефективнішої роботи в Internet необхідна настроювання Internet Explorer. Параметри оптимальної настройки залежать от:

. властивостей відеосистеми компьютера;

. продуктивності чинного з'єднання з Internet;

. змісту поточного Web-документа;

. особистих переваг пользователя.

Налаштувати Internet Explorer можна що з самої програми, і через Панель управления.

Якщо браузер нездатний відображати файли певного типу (*.exe, *.zip тощо.) ініціюється процес завантаження даного файла на комп’ютер. Програма Internet Explorer 5.0 запускає майстер завантаження файлів, першою етапі роботи якого вимагають вказати чи відкривати файл чи зберегти його на локальному диску. Найчастіше файл зберігається. Це дозволяє використовувати його на подальшу роботу, виходячи в Internet. Цей процес відбувається називається простіше — скачати файл.

Netscape Navigator — одну з найкращих Web-браузеров, головна програма пакета Netscape Communicator. З його за допомогою можна переглядати вміст Web-страниц, копіювати файли, шукати різноманітних інформацію, працювати з оповіддю та мультимедійними файлами Internet.

Обидва браузери мають переваги. Например:

. Internet Explorer поставляється безплатно у складі програмного забезпечення фірми Microsoft;

. Internet Explorer має як широкі можливості при настроюванні на конкретні смаки споживача й більше кількість виконуваних функций;

. Netscape Navigator — має велику швидкість під час роботи з Webстраницами.

Але у принципі, обидва браузери виконують схожі завдання й повністю задовольняють запити користувачів під час роботи з Internet.

Однією з основних архітектурні особливості Explorer є застосування ActiveX — технології, що дозволяє зручно конфіґурувати, наприклад, вигляд і можливості панелі інструментів, що робить комп’ютер доступним навіть детей.

Обидва браузери підтримують можливість створення HTML-документов, при що ж Explorer дозволяє створювати темплайты, що також спрощує створення web-страниц.

Internet Explorer підтримує найпоширеніші мови, полегшуючи користувальницький інтерфейс, підтримує все основні мережні стандарти передбачає інтерфейс без використання миші і можливість змінювати шрифт для зручності просмотра.

Що ж до швидкості перегляду Web-страниц, то Microsoft стверджує, що Navigator програє швидкістю, по крайнього заходу, на 30 процентов.

Netscape підкреслює відмінність Navigatora з інших браузерів, а особливості від Internet ExplОrer, кількістю яка потрібна на нього пам’яті, швидкістю роботи, значними зручностями для творців Web-документов, наявністю системи, що дозволяє комп’ютера користуватися телефонними послугами Інтернет у режимі реального часу. До того йому це дозволяє уникнути незручностей звичайного телефонного связи.

Коли Netscape несподівано побачила ринку, Microsoft довелося негайно відреагувати, ніж втратити частину своїх бізнесів. Без такий нещадній конкуренції між двома гігантами було б ні такого широкого використання Web, ні комерційних Web-серверов, ні недорогих браузерів з графічними інтерфейсами. Це суперництво породило недорогі продукти, які, завдяки використанню протоколів Internet, здатні до взаємодії. Подолати несумісність різних HTML простіше, ніж труднощі, які б виникнути, вважають оптимисты.

3. ПОШУКОВІ СИСТЕМЫ.

Основне завдання Internet — надання необхідної інформації. Щоб знайти потрібні інформацію треба зазначити адресу Webсторінки, на якої ця інформація міститься. Найкраще шукати у Мережі необхідну інформацію з допомогою пошукових систем. Пошукова система є спеціалізований Webвузол. Пошукові системи класифікують методами поиска.

Пошукові каталоги призначені на допомогу пошуку на теми. Зазвичай вони побудовано по ієрархічному принципу, тобто. кожен крок пошуку такий вибір підрозділу конкретнішою тематикою шуканої інформації. На нижньому рівні пошуку користувач отримує відносно невеликий список посилань на потрібну информацию.

Пошуковий індекс забезпечує пошук по заданим ключовим словами. Зазвичай ключове слово вводяться під час заповнення спеціальної форми пошуку, після чого нажимается кнопка «Пошук». Через війну пошуку формується набір гіперпосилань на Webсторінки, у якому зазначені терміни. Зазвичай пошукові індекси видають дуже багато шуканих страниц.

У списку представлені посилання різні Webсторінки, причому посилання розташовуються за рівнем зменшення із зустрінутих на даних сторінках слів, збігаються з ключовими словами. При перегляді списку необхідно вибрати ті сторінки, потрібно переглянути. Деякі системи становлять список посилань за рівнем свіжості сторінок, інші - по ступеня ймовірності те, що дані сторінки виявляться шуканими. Обчислення ймовірності полягає в даних у тому, як швидко сторінка зустрічається шуканим словом. Першими на списку йдуть посилання ті сторінки, які мають ключове слово зустрічаються вже у названии.

Пошукові каталоги надають доступом до меншій кількості сторінок, ніж пошукові індекси, але де вони точніше свідчить про основні ресурси Мережі. Тому, за первинному пошуку інформації доцільно використовувати пошукові каталоги. А кваліфікованим користувачам Internet більш корисні пошукові індекси. Вони дозволяють розшукати маловідомі і вузькоспеціалізовані ресурси. Багато сучасні пошукові системи поєднують у собі обидва зазначених метода.

Програма Internet Explorer 5.0 має спеціальні кошти організації пошуку без явного звернення до пошукових системам. Можна одержати доступ одного з відомих пошукових систем, просто клацнувши на кнопці «Пошук», зліва з’явиться вікно пошуку. Далі можна набрати ключові слова на допомогу пошуку і вибрати пошукову систему. Результати пошуку будуть відбито у правій частині вікна оглядача. Якщо вибрати потрібну заслання, то правом вікні з’явиться вміст обраної сторінки. Щоб сховати вікно пошуку, необхідно клацнути на кнопці «Пошук» ще раз.

Працюючи з Internet ЕхрLorer робити пошук просто у полі «Адреса». І тому в адресну рядок вводитися слово чи фраза на допомогу пошуку. Під адресної рядком відкриється вікно щодо слова «Пошук» і шуканої фразою. Internet Explorer почне пошук з допомогою наперед визначеної системи пошуку; у своїй кнопка «Пошук» на панелі інструментів нажмется сама.

Можна здійснити пошук натиснувши кнопку «Пуск» і обравши опцію меню «Знайти». Вікно Internet Explorer відкриється саме з роботи вже натиснутої кнопкою «Поиск».

Якщо вдалося віднайти те, що шукали, проте ні то, то цьому разі знадобиться механізм пов’язаних посилань. Для будь-який Webсторінки можна переглянути список посилань, мають до неї ставлення, можливо, у тому числі виявиться саме те, що потрібно. Щоб переглянути пов’язані посилання, потрібно вчинити ось як. Необхідно вибрати в меню «Сервіс» команду «Показати пов’язані ссылки».

Після цього панелі інструментів натиснути кнопку «Пошук», й у лівої частини екрана повниться вікно, що містить список посилань, що з даної сторінкою. Потрібно клацнути одній із посилань, і переглянути у правому вікні відповідну Web-страницу.

Щоб сховати вікно пошуку, необхідно клацнути вкотре на кнопці «Поиск».

3.1. Механізми поиска.

Пошукові cистемы зазвичай складаються із трьох компонентов:

. агент (павук чи кроулер), який переміщається Мережею і збирає информацию;

. база даних, що містить усю інформацію, що збирається пауками;

. пошуковий механізм, яке використовують як інтерфейс для взаємодії з базою данных.

Cредства пошуку істини та структурування, іноді звані пошуковими механізмами, йдуть на здобуття права допомогти людям знайти інформацію, в якому вони нуждаются.

Cредства пошуку типу агентів, павуків, кроулеров і роботів використовуються для збору інформації документи, що у Мережі Інтернет. Це спеціальні програми, які шукають сторінок на Мережі, витягають гіпертекстові посилання цих сторінках і автоматично індексують інформацію, що вони знаходять для побудови бази данных.

Кожен пошуковий механізм має власний набір правил, визначальних, як cобирать документи. Деякі йдуть за кожної посиланням з кожної знайденою сторінці і далі, своєю чергою, досліджують кожну посилання кожної із нових сторінок, тощо. Деякі ігнорують посилання, які ведуть до графічним і звуковим файлам, файлам мультиплікації; інші ігнорують cсылки до ресурсів типу баз даних WAIS; інші проинструктированны, що потрібно переглядати передусім найбільш популярні страницы.

Агенти — самі «інтелектуальні» з пошукових коштів. Вони можуть робити більше, ніж просто шукати: можуть виконувати навіть транзакції від Вашого імені. Вже зараз вона можуть шукати cайты специфічної тематики і повертати списки cайтов, відсортованих з їхньої відвідуваності. Агенти можуть обробляти зміст документів, знаходити і індексувати решта видів ресурсів, як сторінки. Вони можуть також бути запрограмовані для вилучення інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад базі даних пошукового механизма.

Агенти витягають і індексують різні види інформації. Деякі, наприклад, індексують кожне окреме слово у встречающемся документі, в нас саме інші індексують лише найважливіших 100 слів у кожному, індексують розмір документи й число слів у ньому, назва, заголовки і підзаголовки тощо. Вигляд побудованого індексу визначає, який пошук може бути зроблений пошукових механізмом як і отримана інформація буде интерпретирована.

Агенти можуть також переміщатися по Internet і визначити інформацію, після чого поміщати їх у базі даних пошукового механізму. Адміністратори пошукових систем можуть встановити, які сайти чи типи сайтів агенти повинні ще й проіндексувати. Проіндексована інформація відсилається базі даних пошукового механізму як і, як було зазначено описано выше.

Загальний пошук інформацією Мережі здійснюють програми, відомі як павуки. Павуки повідомляють над реальним змістом знайденого документа, індексують його й витягають підсумкову інформацію. Вони також переглядають заголовки, деякі посилання і посилають проіндексовану інформацію базі даних пошукового механизма.

Кроулеры переглядають заголовки і повертає тільки першу ссылку.

Роботи можна запрограмувати те щоб переходити різноманітні cсылкам різної глибини вкладеності, виконувати індексацію і навіть перевіряти заслання документі. Через їх природи можуть застрявати в циклах, тому, йдучи посилань, їм потрібні значні ресурси Мережі. Проте, є методи, призначені у тому, щоб заборонити роботам пошук сайтами, власники яких немає бажають, щоб були проиндексированы.

Люди можуть поміщати інформацію просто у індекс, заповнюючи особливу форму у тому розділу, куди вони хотіли б помістити свою інформацію. Ці дані передаються базі данных.

Коли хтось хоче інформацію, доступну в INTERNET, він відвідує сторінку пошукової системи та заповнює форму, детализирующую інформацію, яка необхідна. Тут можна використовувати ключові слова, дати й інші критерії. Критерії у вигляді пошуку повинні відповідати критеріям, що використовуються агентами при індексації інформації, що вони знайшли при переміщенні по Сети.

База даних відшукує предмет запиту, заснований на інформації, яка вказана у заповненою формі, і виводить відповідних документів, підготовлені базою данных.

Щоб співаку визначити порядок, у якому список документів покажуть, база даних застосовує алгоритм ранжирування. У ідеальному разі, документи, найбільш релевантні користувальницькому запиту будуть можна побачити перші списку. Різні пошукові системи використовують різні алгоритми ранжирування, проте, основні засади визначення релевантности следующие:

1. Кількість слів запиту в текстовому вмісті документа.

2. Теги, де ці слова располагаются.

3. Місце Розташування шуканих слів в документе.

4. Питома вага слів, яких визначається релевантность, у кількості слів документа.

База даних виводить ранжированный таким чином список документів з HTML і повертає його людині, зробив запрос.

Різні пошукові механізми також вибирають різні способи показу отриманого списку — деякі показують лише; інші виводять cсылки з першими кількома реченнями, які у документі чи заголовок документа разом із ccылкой.

Коли Ви клацаєте на засланні до жодного з документів, який вас цікавить, цей документ ще запитує в одного серверу, де вона находится.

3.2. Порівняльний огляд пошукових систем. Структура запроса.

У «тенета існують різноманітні способи пошуку інформації. Звісно ж, якщо є довідник, де можна знайти місцезнаходження даного вас джерела конкретної інформації, то, це без будь-якого сумніви, слід цим правилом і скористатися. Проте, на жаль, такі видання які завжди доступні. З іншого боку, мережу є постійно оновлення системою та тому перебуває у курсі всього нового з допомоги періодики, а з допомогою літератури, який завжди представляється можливим. Для пошукових цілей у Internet існують спеціальні пошукові машини, що володіють значними базами даних, і мають зв’язку з собі подобными.

Істотно корисними можливостями в них наявність системи пошуку, побудована за принципом: від загального — до конкретного. Ставлячи загальне поняття (як ключового слова, кількох слів чи фрази, — в залежність від сервісних послуг конкретної машини), та був, з кожним пошуком дедалі більше і більше конкретизуючи його, можна отримати роботу цікавий для результат. Тому далі розглянуті кілька основних пошукових систем, використання є дуже эффективно.

Історично склалося так, що першою такий пошукової машиною була Alta Vista, тому з неї й почнемо рассмотрение.

AltaVista. Найцікавіша можливість AltaVista — це розширений пошук. AltaVista дозволяє пошук по ключовим фразам, цьому вона має досить великий фразеологічний словник. До того ж, у пошуку в AltaVista можна поставити ім'я поля, де має зустрітися слово. До жалю, докладно процедура ранжирування в документації у системі не описана, але видно, що ранжування застосовується як із простому пошуку, так і за розширеному запиті. Реально неї можна зарахувати до системі з розширеним булевым поиском.

Lycos. Як і більшість систем, Lycos дає можливість застосовувати простий запит і більше витончений метод пошуку. У простому запиті в ролі пошукового критерію вводиться пропозицію природному мові, після чого Lycos виробляє нормалізацію запиту, видаляючи потім із нього так звані stop-слова, і після цього приступає до її виконання. Майже видається інформацію про кількості документів кожне слово, а й список посилань на формально релевантні документи. У творчому списку проти кожного документу зазначається його міра близькості запиту, кількість слів з запиту, яких спіткало документ, і оцінна міра близькості, яка то, можливо більшою або меншою формально вычисленной.

Поки не можна вводити логічні оператори в рядку разом із термінами, але використовувати логіку системою меню Lycos дозволяє. Така можливість застосовується для побудови розширеній форми запиту, настановленим досвідчених користувачів, вже навчилися працювати з цим механизмом.

Yahoo. Ця система з’явилася Мережі однією з перших, і сьогодні Yahoo співпрацює із багатьма виробниками коштів інформаційного пошуку, але в її серверах використовується різне програмне забезпечення. Мова Yahoo досить простий: все слова слід вводити через прогалину, вони з'єднуються зв’язкою «and» або «or».

При видачі не вказується ступінь його відповідності документа запиту, а лише підкреслюються слова з запиту, які у документі. У цьому немає нормалізація лексики і проводиться аналіз на «загальні» слова. Хороші результати пошуку виходять тільки тоді ми, коли користувач знає, що у базі даних Yahoo інформація є напевно. Ранжування проводиться у разі числу термінів запиту в документе.

Yahoo належить до класу простих традиційних систем з обмеженими можливостями поиска.

OpenText. Інформаційна система OpenText є самий комерціалізований інформаційний продукт у Мережі. Усі описи більше нагадують рекламу, ніж информативное посібник з роботі. Система дозволяє провести пошук з допомогою логічних коннекторов, проте розмір запиту обмежений трьома термінами чи фразами. У разі мова про розширеному пошуку. При видачі результатів повідомляється ступінь відповідності документа запиту і величину документа.

Система дозволяє також поліпшити результати пошуку стилі традиційного булевого пошуку. OpenText можна було б зарахувати до розряду традиційних інформаційно-пошукових систем, але механізм ранжирования.

Infoseek. Система Infoseek має досить розвиненим інформаційнопошукових мовою, що дозволяє непросто вказувати, які терміни повинні зустрічатися в документах, а й своєрідно зважувати їх. Досягають цього з допомогою спеціальних знаків «+» — термін має бути у документі, і «-» — термін повинен відсутні в документе.

Крім цього, Infoseek дає змогу провадити те, що називається контекстным пошуком. Це означає, що, використовуючи спеціальну форму запиту, можна зажадати послідовної спільної народження слів. Також можна вказати, деякі слова повинні спільно зустрічатися у одному документі, а навіть у окремому параграфі чи заголовке.

Є можливість вказівки ключових фраз, що становлять єдине ціле, до порядку слів. Ранжування під час видачі здійснюється за числу термінів запиту у документі, за кількістю фраз запиту з відрахуванням загальних слів. Усі ці фактори використовують як вкладені процедури. Підбиваючи стисле резюме, можна сказати, що Infoseek належить до традиційним системам з елементом зважування термінів при поиске.

WAIS. WAIS є одним із найвигадливіших пошукових систем INTERNET. У ньому не реалізовані лише пошук по нечітким безлічам і імовірнісний пошук. На відміну багатьох пошукових машин, система дозволяє будувати як вкладені булевые запити, вважати формальну релевантность різноманітні заходам близькості, зважувати терміни запиту і документа, а й здійснювати корекцію запиту з релевантности. Система дає підстави використовувати усечения термінів, розбивка документів на поля і ведення розподілених индексов.

Rambler. Пошукова система містить інформацію про більш як 12 мільйонах документів, розташованих на серверах Росії та країн СНГ.

Rambler обробляє щодоби щонайменше 500 тисяч пошукових запитів (загалом — 5 запитів в секунду), скануючи 48 тисяч Web-серверов і використовуючи кілька одночасно працюючих программ-роботов.

Запит може складатися зі однієї чи кількох слів, розділених прогалинами. Може бути використані як російські, і англійські слова словосполучення. За умовчанням знаходяться тільки ті документи, у яких зустрілися усі запроваджені Вами слова.

Щоб знайти документи, містять хоча одне слово з запиту, використовується логічна зв’язка «or» чи вибирається сторінка детального запиту: «Слова запиту: будь-яке». Щоб виключити документи, містять ті чи інші слова, слід зазначити сторінка детального запиту: «Виключити документи, містять такі слова …».

Однак, з яким літери написані слова запиту: з великою чи з маленькій. І за побудові індексу, і за пошуку на запит все заголовні (великі) літери «понижаются».

Слова запиту може бути з'єднані логічними зв’язками «and», «or». Замість зв’язок (чи поєднані із ними) можна використовувати також символи «&», «|».

Частини запиту може бути згруповані з допомогою круглих скобок. Можлива багатократний вкладеність скобок разом із логічними операторами.

Rambler вміє шукати слова переважають у всіх формах (наприклад, амінокислота, амінокислоти, амінокислотою тощо. буд.). Щоб слово перебувало переважають у всіх формах, проти нього треба поставити службовий символ «#». У меню детального запиту такий режим можна включити всім слів: «Розширення запиту: всі форми слів». Службовий символ «@» перед словом дозволяє знаходити не лише це слово, а й однокореневі слова. У меню детального запиту символу «@» відповідає режим «Розширення запиту: все однокоренные».

За умовчанням наша система шукає слова запиту оскільки Ви їх запровадили, аби знизити «шум» в знайдених документах. Якщо ви не пам’ятаєте, як пишеться слово, чи хочете розширити запит, можна використовувати метасимволы «*» і «?» для позначення довільній частини слова довільного символа.

Обмежити пошук частинами документів, такі як назва документа, його заголовок, URL тощо., можна через меню детального запиту «Шукати в…».

Можна обмежити пошук документами лише російською або тільки на англійській. І тому треба вибрати відповідний режим в меню детального запиту «Мова документа…». За умовчанням пошук виконується по документам усім языках.

За умовчанням знайдені документи сортуються по релевантности (відповідності запиту). Проте Можете зажадати, щоб натомість початок списку посадили найсвіжіші (чи, навпаки, найстаріші документи). І тому треба вибрати відповідну установку в меню «Сортувати по…» сторінка детального запроса.

Можете також обмежити пошук документами, створеними в певний період: цього необхідно сторінка детального запиту вказати «Від дати … до дати …».

Можна зажадати, щоб Rambler повертав ті документи, де слова з запиту перебувають у мінімальному відстані один від друга.

Режим «Обмежити відстань між словами» можна включити в детальному запиті. Усі перелічені вище правила можна використовувати спільно друг з одним в необхідної Вам последовательности.

За умовчанням результати пошуку видаються порціями по 15 документів. Меню «Видавати по…» сторінка детального запиту дозволяє їх кількість до 30 чи 50. Меню «Форма виведення…» дає змогу отримувати описи документів зі збільшеною чи зменшеній подробностью.

Yandex. Yandex щодня переглядає сотні тисяч Web-страниц в пошуках змін чи нових посилань. Колекція посилань постійно растет.

Yandex не жадає від вас знання спеціальних команд на допомогу пошуку. Досить набрати питання («де знайти дешеві комп’ютери» чи «потрібні телефони москви і московської області»), й ви отримаєте результат — список сторінок, де зустрічаються ці слова.

Незалежно від цього, як і формі ви вжили слово в запиті, пошук враховує усі його форми за правилами російської. Наприклад, якщо заданий запит «йти», то результаті пошуку знайдуть посилання документи, містять слова «йти», «йде», «йшов», «йшла» тощо. На запит «вікно» буде видана інформація, що містить і слово «вікон», але в запит «відкликали» — документи, містять слово «отозвали».

У цьому пошук необмежений на словах чи фразами. Yandex знайде по назві Web-страницу компанії файл із потрібним картинкой.

Aport. Зазвичай запит представляє з себе просто одне чи кілька слов.

Таким запиту перебувають документи, у яких трапляються дедалі слова запиту. Є, щоправда, обмежену кількість слів (союзи, приводи тощо.), які у запиті ігноруються, бо несуть власними силами значеннєвий нагрузки.

Наприклад, на запит: яблука на снігу знайдуть всі документи, в яких зустрічаються одночасно два слова: «яблуко» і «сніг». Де в межах документа розташовані слова, як і граматичної формі вони перебувають — не важно.

Варто вкотре підкреслити важливу і дуже корисний властивість Апорту: незалежно від цього, як і граматичної формі ви пишіть в запиті слово, вона перебуває в документах в усіх власних формах. Наприклад, на запит: людина йшов знайдуть серед інших і документи, містять текст «люди йдуть». Розпізнавання всіх форм працює для звичайних слів російської. Для екзотичних слів, неологізмів тощо. він проходить. І тут може знадобитися оператор «*».

Наприклад, ви бажаєте знайти, що стосується діяльності президента Росії, зокрема і документи, містять слово «ельцинизм». Скористайтеся запитом: єльцин*. Він дозволить вам знайти те, що собі хочете (і навіть документи з словами Ельцинище, ельцинцы, ельциненок тощо), оскільки зірочка заміняє собою будь-яке число будь-яких букв.

Можете шукати документи як з усього російськомовному INTERNET, а й у його частину. Найпростіший випадок — пошук за певним серверу. Наприклад: url=internet собака.

За таким запиту знайдуть всі документи на сервері internet містять слово «собака ». Можливо, вам цікаво, що буде, якщо написати просто: url=internet.

І тут ви отримаєте список всіх документів, розташованих на зазначеному вами сервере.

Можете обмежувати пошук і освоєння сильніше — однією з каталогів серверу. Наприклад: url=internet.

За таким запиту документи, містять слово «сенбернар», будуть шукатися лише у каталозі /sobaki (та її підкаталогах) московського серверу корпорації Intel.

List. На головною сторінці у верхній її частки розташовані посилання найпопулярніші проекти. Нижче, під логотипом каталогу, пошукова форма. У правої колонці та нижньої частини сторінки — блоки найактуальніших новин. Список посилань на основні категорії каталогу займає центральну частина. Цифри поруч із назвою категорії показують кількість сайтів, які у ній. Записані дрібненько заголовки відсилають при нажатиии на підкатегорії розділу. Клацнувши за будь-яким з назв, Ви потрапите в відповідну рубрику й під логотипом List.ru побачите повний шлях досяжна, починаючи з головної сторінки. Кожен проміжного рівня структури доступний по окремої засланні. Пошук в каталозі реалізований в такий спосіб, у результаті запиту може бути знайдено як окремі сайти, і рубрики.

Допускається використанням мови запитів Yandex. Розташована поруч з пошукової формою посилання «Структура каталогу» відкриває окремому вікні повний рубрикатор каталогу. Реалізовано можливість переходу із рубрикатора на будь-яку обрану подкатегорию. Більше детальне тематичне розподіл поточної рубрики представлено списком ссылок.

Позначені символом «@» наведуть аргументи на підкатегорії, структурно що входять до інші розділи, але містять близьку за змістом інформацію. Якщо ви добре уявляєте, як і рубриці містяться потрібні ресурси, краще перейти у потрібний подкатегорию, скориставшись будьяким зі наданих коштів навігації за каталогом. Інакше можна шукати в повному списке.

Каталог організований в такий спосіб, що це сайти, що містяться на нижніх рівнях структури, представлені й у рубриках. Показуваний нижче список ресурсів упорядкований в алфавітному порядку, але, обравши відповідну сортування («За час додавання» чи «По переходами»), можна переглянути їх за порядку додавання до каталогу (починаючи від самих «свіжих») чи залежність від популярності серед відвідувачів каталогу. Посилання в назві сайту відкриває окремому вікні його зареєстровану у даної рубриці сторінку. Позначки RUS і ENG означають наявність з сайту сторінок, відповідно російською й англійською мовами языках.

4.

ЗАКЛЮЧЕНИЕ

.

З розвитком INTERNET з’явилася можливість швидкого й зручного пошуку необхідної документальної інформації. Нині можна не займатися добором і вивченням величезної кількості літератури у книгарнях і бібліотеках. Інформацію можна отримати роботу, виходячи з дому або офісу. Для цього потрібен безпосередньо сам комп’ютер, підключений до INTERNET з встановленої спеціальної програмою — браузером, предназначеной для перегляду вмісту Web-страниц.

Завдяки розмаїттям пошукових систем, спеціально розроблених для пересічного користувача, кожний легко відсікти явно непотрібний потік інформації, лише правильно сформулювавши мета поиска.

5. СПИСОК ВИКОРИСТАНОЇ ЛИТЕРАТУРЫ.

1. М. Пайк. Internet. СПб., 1996.

2. Пол Гилстер. Навігатор Internet. М., 1995.

3. Енциклопедія Інтернет, СПб, 2001.

4. Інформатика. Базовий курс. Підручник для вузів, СПб, 2001.

5. How the browsers compare//internet.

6. Нэш К.//Война браузеров.-Сети.-1997г.-№ 1.-с.31.

7. Крол Эд//Всё про Internet.-Киев.-Торгово-изд. бюро BHV.-1995г.-с.33.

8. Крол Эд//Всё про Internet.-Киев.-Торгово-изд. бюро BHV.-1995г.-с.50.

9. Крол Эд//Всё про Internet.-Киев.-Торгово-изд. бюро BHV.-1995г.-с.100.

Показати весь текст
Заповнити форму поточною роботою