Пошукові машини в Інтернет
Обратимся до історії започаткування мережі Internet, створена в зв’язку з виниклою необхідністю спільного використання інформаційних ресурсів, розподілених між різними комп’ютерними системами. Більшість перших додатків, включаючи FTP і електронної пошти, були розроблені винятково обмінюватись даними між хост-компьютерами Internet. Інші докладання, такі як Telnet, створювалися у тому, щоб… Читати ще >
Пошукові машини в Інтернет (реферат, курсова, диплом, контрольна)
2. Пошукові системи та машини в Internet.
Обратимся до історії започаткування мережі Internet, створена в зв’язку з виниклою необхідністю спільного використання інформаційних ресурсів, розподілених між різними комп’ютерними системами. Більшість перших додатків, включаючи FTP і електронної пошти, були розроблені винятково обмінюватись даними між хост-компьютерами Internet. Інші докладання, такі як Telnet, створювалися у тому, щоб користувач отримав таку можливість доступу як до інформації, до робочим ресурсів віддаленій системи. З розвитком Internet (збільшення користувачів і хост-компьютеров) колишні методи обміну даними перестали відповідати зрослим потребам користувачів. Виникла необхідність розробки нових засобів пошуку мережевих ресурсів немає і доступу до них, які давали можливість використовувати інформацію незалежно від неї формату і розташування. Для задоволення такої потреби спочатку було створено пошукова система Archie, вирішальна завдання локалізації ресурсів на FTPсервері, і системи Gopher, упрощающая доступом до різним мережним ресурсів. Потім розробили мережні інформаційні системи WWW і WAIS, які пропонують цілком нові методи отримання. Принципи роботи цих систем дозволяють легко орієнтуватися у величезній кількості інформаційних ресурсів без необхідності надання механізмів роботи самої мережі Internet. Такий їхній підхід дозволяє не просто про ресурсах взаємозалежних комп’ютерних систем, а про особливих інформаційних просторах мережі. FTP (File Transfer Protocol, Протокол передачі файлів) регламентує процедуру передачі файлів між комп’ютерами. Сервіс, наданий FTP, відрізняється необхідністю безпосереднього сполуки між комп’ютерами, що у процесі обміну даними, і необхідністю ідентифікації користувача визначення його прав доступу до каталогам і файлам віддаленій системи. Однією проблеми доступу інформації з допомогою FTP є неможливість визначити, які файли можна знайти в FTP-сервере без попереднього встановлення з нею з'єднання з них і перегляду структури каталогів. Система UseNet було розроблено підтримки телеконференцій. Для їх ведення організуються спеціальні рубрики, назви яких відбивають загальне зміст телеконференції. Основним гідністю UseNet є можливість отримання практично будь-який інформацією досить короткі терміни. Єдина проблема, що виникає у користувача, залежить від виборі телеконференції, де він може мати простий у відповідь своє питання. Це завдання допомагає розв’язати ієрархічна система імен телеконференцій в UseNet. З іншого боку, система UseNet було розроблено обміну виключно текстовій інформацією, для передачі бінарних файлів необхідно попередньо скористатися програмою, конвертирующей дані. Система Archie є комплексом програмних засобів, працюючих зі спеціальними базами даних. У цих базах даних міститься постійно пополняющаяся інформацію про файлах, до котрих отримання доступу через сервіс FTP. Користуючись послугами системи Archie, можна здійснити пошук файла по шаблоном його від імені. У цьому користувач отримає список файлів з точним зазначенням місця їх збереження у мережі, ні з інформацією щодо типі, створення і розмірі файлів. Доступ до інформаційно-пошукової системі Archie може здійснюватися різними шляхами, починаючи з запитів по електронної пошти і з допомогою сервісу Telnet і до використанням графічних Archie-клиентов. Система Gopher було розроблено спрощення процесу локалізації FTPресурсів Internet й у зручнішого надавання даних над реальним змістом що зберігаються на FTP-серверах файлів. Система Gopher дає можливість у зручною формі (як меню) представляти користувачам про наявні файлах та його змісті. Меню Gopher-серверов можуть утримувати посилання інші Gopherі FTP-серверы. Посилання на FTP-сервер дозволяє як переглянути її каталоги, і автоматично отримати файл. Отже, користувач має можливість «подорожувати» по Internet, не звертаючи увагу місцезнаходження цікавих йому ресурсів, і реально отримувати доступом до цим ресурсів. Система Veronica використовується на допомогу пошуку інформацією Gopher-пространстве по заголовкам пунктів меню. Після введення ключового слова, система Veronica з’ясовує, зустрічається воно в меню на якомусь Gopher-сервере, й у ролі результатів пошуку видає список заголовків пунктів меню, містять ключовим словом. Оскільки система Veronica перестав бути автономної пошукової програмою, а міцно пов’язана і системи Gopher, вона має тим самим, як і система Gopher, недоліком: які завжди по заголовку можна сказати, що являє собою той чи інший інформаційний ресурс. Переваги системи у тому, що не потрібно впізнавати, де міститься знайдена інформація, досить вибрати необхідну запис зі списку. Основою системи WAIS є комплекс глобальних баз даних, у яких міститься індексована інформацію про ресурсах мережі. Система WAIS забезпечує розподілений пошук тексту у тих базах даних із ключового слову чи рядку. Отже, сервіс WAIS передусім орієнтовано зміст текстових документів, а чи не на назви і формат файлів, в що вони зберігаються. У системі також реалізовані зв’язку з різноманітними базами даних, що зберігаються інших хост-компьютерах, і механізм отримання необхідного документа. На додачу до цього системі WAIS досить просто реалізований механізм додавання нових баз даних до існуючих. Документи, у яких система WAIS здійснює пошук, зазвичай представляють собою текстові файли, що мати будь-який величину і утримувати будь-яку інформацію. Найбільш нове і найбільш досконалим засобом пошуку, отримання й відображення інформацією Internet є система World Wide Web (WWW). Цю систему надає користувачеві можливість, працюючи з графічним інтерфейсом, переглядати документи, що зберігаються на хост-компьютерах в Internet, причому для переміщення між документами використовуються гіпертекстові зв’язку (посилання). Ці посилання входять у документи системи WWW і може вказувати на будь-які інформаційні ресурси Internet. WWWдокументи (WWW-страницы) готуються на спеціально розробленому мові - HTML (Hypertext Markup Language, Мова розмітки гіпертексту), доступному звичайним користувачам, і дозволяє включати у WWW-страницы крім текстовій інформації зображення, посилання інших документів, інші додаткові елементи інтерфейсу, такі як інтерактивні форми для введення даних при працювати з документом, й багато іншого. Важливим гідністю системи WWW і те, що графічний інтерфейс багатьох програм перегляду WWW (WWWбраузерів) заохочує працювати із цією системою дуже легкої для початківців користувачів, які мають досвіду роботи у Internet. Користувачі системи WWW теж зобов’язані знати, й у жодній формі зберігаються дані, оскільки WWWбраузер сам виконує більшу частину роботи. У системі WWW є також доступом до спеціально розроблених пошукових системам (пошукових машинам), які виконують пошук WWW-страниц, містять інформацію на задану з допомогою ключових слів тему. Пошук виробляється серед заздалегідь проіндексованих WWW-страниц безлічі серверів Internet, і результатом пошуку є автоматично сгенерированная нова WWW-страница, яка містить посилання знайдені документи. Це надзвичайно потужний засіб робить дуже легкої і тому зручною для користувачів процедуру пошуку інформацією Internet, а результат пошуку дає можливість уявити в наочної формі. Найпотужнішими пошуковими машинами нині у світі є: Alta Vista (internet Yahoo! (internet Infoseek (internet GoTo (internet FTP search (ftpsearch.ntnu.no — пошук у системі FTP), і навіть вітчизняні: Rambler (internet Yandex (yandex.ru), АПОРТ! (internet Слідопит (internet Compass (compass.tsu.ru), Russian FTP search (ftpsearch.city.ru — пошук у системі FTP). Слід зазначити, що результатом пошуку може бути як HTML-документы, що зберігаються на WWWсерверах, а й інші типи файлів інших типах серверів, що інформація про ці документах міститься у відповідних базах даних пошукових машин.