Аналітико-синтетичні засоби обробки інформації
Національний архівний фонд формується в порядку, встановленому Законом «Про Національний архівний фонд та архівні установи», з архівних документів органів державної влади, органів місцевого самоврядування, підприємств, установ і організацій усіх форм власності, а також архівних документів громадян і їх об'єднань. Держава вживає заходів для поповнення Національного архівного фонду документами… Читати ще >
Аналітико-синтетичні засоби обробки інформації (реферат, курсова, диплом, контрольна)
ВСТУП Актуальність роботи.
З кожним роком зростає обсяг і потужність інформаційного потоку. Упорядкувати цей потік і тримати його в контрольованому руслі можна тільки за допомогою автоматизованих систем обробки та переробки інформації. В основі цих систем (методів) лежать процеси аналізу первинних документів (індексація і предметизація) і синтезу (генерація вторинних документів, складання каталогів). У закінченому вигляді (база даних первинних документів, бібліографічні описи та засоби пошуку) разом з пам’ятника минулого і становлять національну спадщину країни.
Завдання роботи.
1. Проаналізувати значення і способи обробки інформації.
2. Отримати уявлення про «понятті національну спадщину».
3. Вивчити поняття індексації, предметизації, анотування і реферування.
4. Оволодіти аналітико-синтетичним методом обробки документів.
Методи роботи: порівняльно-зіставний, типологічний.
Новизна роботи відповідає науковим джерел, використаних у курсовій роботі.
Структура роботи.
Курсова робота складається з вступу, двух розділів, висновків, трьох додатків і списку використаної літератури. У першому розділі розглядаються види наукової обробки документів, поняття «національна спадщина», основні положення аналітико-синтетичного способу обробки документів. У другій — вивчаються процеси індексації, предметизації, анотування і реферування в контексті інформаційних технологій. У додатках розглянуті музейні, архівні и бібліотечні фонди. Список літератури складається з 24 джерел.
Розділ 1. Поняття та види наукової обробки документів
1.1 Суть, значення і види наукової обробки документів Суть наукової обробки документів полягає в процесі створення і перетворення документів. Цей процес призначений для полегшення користувачеві пошуку та виявлення необхідної інформації. Основними операціями (видами) наукової обробки документів є: класифікація, сортування, перетворення, розміщення в базі даних і пошук.
Кожному дослідникові необхідно вміти шукати і відбирати потрібну літературу для своєї роботи, тобто володіти знанням основ бібліографії. Бібліографія інформує читача (користувача) про наявні друкованих виданнях, для чого складаються покажчики, каталоги, огляди.
Процес ознайомлення з літературними джерелами по цікавить проблематики необхідно починати з ознайомлення з довідковою літературою (універсальні та спеціальні енциклопедії, словники, довідники), потім проглядаються обліково-реєстраційні видання органів науково-технічної інформації (НТІ).
Власна бібліографія з цікавить проблеми складається на основі бібліотечних каталогів (це покажчики творів друку, що є в бібліотеці), що представляють собою набір карток, у яких містяться відомості про книгах, журналах, статтях і т.д. У картку книги вносяться її автор, заголовок, вид видання, місце видання, видавництво, рік видання, кількість сторінок. У картці журнальної статті вказуються автор, назва, назва журналу, рік видання, том, номер випуску, кількість сторінок. У картці газетної статті крім автора і заголовку приводяться назву газети, рік, число і місяць. При посиланні на документи і складанні переліку джерел необхідно звертати увагу на знаки пунктуації між елементами бібліографічного опису і застосовувати їх тільки так, як дано у картці.
Читацькі каталоги, що носять довідково-рекомендаційний характер, бувають трьох видів: алфавітний, систематичний і алфавітно-предметний.
Алфавітний каталог називається так тому, що його картки розташовані в алфавітному порядку прізвищ авторів або заголовків творів, якщо автор не зазначений. Завдяки цьому всі книги одного автора (індивідуального або колективного) зібрані в одному місці.
Основним у бібліотеках є систематичний каталог. Картки в ньому розташовані за галузями знань. Цей каталог дозволяє підібрати літературу за певними галузями знань, причому з його допомогою можна поступово звужувати кордону цікавлять читача питань. Каталог дозволяє також визначити книги, наявні в бібліотеці з тієї чи іншої теми, або дізнатися автора і точна назва книги, якщо відомо тільки її зміст.
У систематичному каталозі бібліографічні відомості наведені в систему знань на основі застосування спеціальної бібліотечної класифікації.
Найбільш широко використовується Універсальна десяткова класифікація (УДК).
Використовується також і вітчизняна Бібліотечно-бібліографічна класифікація (ББК). Архівними установами і державними архівами складено кілька своїх класифікаційних схем систематичного типу. Серед них «Схема єдиної класифікації документальних матеріалів у каталогах державних архівів».
Ключем до систематичного каталогу є алфавітно-предметний каталог. У ньому в алфавітному порядку перераховуються найменування галузей знань, окремих питань і тем, за якими у відділах і підвідділу систематичного каталогу зібрана література, наявна в бібліотеці.
При складанні власної бібліографії з проблеми необхідно уважно переглядати списки літератури, що знаходяться в кінці книг, статей і т. д., або літературу, зазначену у виносках у вже знайдених літературних джерелах.
В процесі читання літератури обов’язково виявляються з посилань і прікніжних списків використаних робіт нові джерела, тому потрібна постійна систематизація матеріалу, його упорядкування відповідно з поставленим завданням. Це можна здійснити, наприклад, за допомогою картотеки, що складається з карток і роздільників.
Створення такої картотеки дозволяє по суті закласти основи майбутніх наукових публікацій. Однак інформація, що міститься у відібраній для вивчення літератури, часом перевищує дійсні потреби для певної роботи. Звідси випливає необхідність попередньо виявляти все потрібне і відкидати зайве. Таким чином, закладаються елементи виборчого читання (спочатку побіжний перегляд джерела, ознайомлення з назвою його розділів і лише потім докладне вивчення обраного змісту).
При роботі з літературними джерелами необхідно вміти правильно читати, розуміти і запам’ятовувати прочитане.
Вчені виявили чотири основних способи обробки інформації при читанні.
Це читання: побуквенное, послоговое, за словами (проглядається перший склад першого слова та перші літери другого слова, решта ж частина слова вгадується), за поняттями (з тексту вибираються тільки окремі ключові слова, а потім синтезується думка, що міститься в одному або декількох реченнях). Читання за поняттями характерно для людей, які мають певні навички, великий запас знань для розуміння матеріалу і хорошу пам’ять.
Для розуміння складного тексту необхідно не тільки бути уважним при читанні, мати знання і вміти їх застосовувати, але й володіти певними розумовими прийомами. Один з них полягає у необхідності сприймати не окремі слова, а пропозиції і навіть цілі групи пропозицій, тобто абзаци. При цьому використовується так звана антиципація — смислова здогад. Швидко читає людина зазвичай по декількох буквах вгадує слово, за кількома словами — фразу, з кількох фразах — сенс цілого абзацу.
Необхідно прагнути, саме так читати досліджуваний матеріал. Для цього можна використовувати так званий диференціальний алгоритм. Відповідно, з яким обробка кожного абзацу починається з виявлення ключових слів, що несуть основну смислове навантаження, після чого будуються смислові ряди, тобто відбувається стиснення тексту шляхом виділення ключових слів і освіти на їх основі лаконічних виразів (це як би просіювання тексту, у результаті якого залишаються зерна сенсу). Після стиснення тексту відбувається процес його якісного перетворення, в результаті якого в оброблюваному повідомленні виявляється тільки справжнє значення його змісту.
При навчанні швидкому читанню ставиться завдання виховання нових звичок, які прискорюють читання. Перший шлях підвищення швидкості читання — виявлення прихованих резервів мозку, активізація процесів мислення при читанні. Один із шляхів вирішення цього завдання — використання алгоритмів.
Інтегральний алгоритм визначає послідовність дій при сприйнятті тексту. Слово «інтегральний» означає, що дія алгоритму поширюється на весь текст в цілому. Для використання інтегрального алгоритму необхідно запам’ятати всі його блоки, розуміти і уявляти собі їх зміст. Сучасна структурна лінгвістика стверджує, що всі суспільно-політичні та науково-технічні тексти мають надмірну надлишковістю-до 75%. Знайти і зосередити увагу при читанні на тематичних елементах тексту і допомагає інтегральний алгоритм читання.
При його використанні значно скорочується час обробки неінформативних елементів тексту.
1.2 Суть, значення і види національної спадщини Пам’ятники минулого і досягнення справжнього складають суть національної спадщини. Значення національної спадщини полягає в спадкоємності поколінь від давнини у майбутнє, коли пам’ятники старовини, розповідаючи про минуле, формують націю як ціле, перетворюють сукупність людей в народ. Види національної спадщини відповідають способу відображення інформації, обраному творцем спадщини.
У їх числі: архітектурні споруди (будівлі, музеї, інститути); пам’ятники образотворчого мистецтва і архітектури (картини, скульптури); літературні твори, музика.
У контексті спеціальності, в рамках якої пишеться курсова робота, нас в більшій мірі буде цікавити документальна форма національного надбання — книжкові пам’ятки історії та культури.
Книга зберігається в різних установах культури — бібліотеках, музеях, архівах, і книги-пам'ятники входять поряд з книгами звичайного використання та іншими матеріалами відповідного профілю в Бібліотечний, архівних та музейних фондів України.
У теоретичному плані стоїть завдання визначення самого поняття «книжковий пам’ятник», видів книжкових пам’яток, критеріїв ідентифікації опису і т.п. Прагматична завдання — принципи і порядок обліку пам’яток, система їх зберігання, безпеки і використання цієї частини національного та світової культурної спадщини.
Книга — складне явище культури. Воно реалізується у єдності опублікованого твору і способу його матеріального втілення, тому аксіоматичним обов’язковість збереження книги у всьому обсязі її характеристик у вигляді, максимально наближеному до первозданного. Здійснення такого завдання виходить за рамки традиційно розуміється меморіальної функції бібліотек, спрямованої на фонди в цілому і орієнтованої головним чином на збереження опублікованих творів, пам’ятників людської думки, тобто наукового, літературно-художньої спадщини. А це можливо й у деформованих примірниках.
Перебувають у загальних фондах бібліотек книга живе своєю природною життям, широко видається для читання, що знаходиться в протиріччі з виконанням книгою історико-культуринх функцій у повному обсязі.
Збереження книги як пам’ятника здійснюється в музеях різного профілю та в архівах у силу особливого характеру використання та обмеження доступу до оригіналів. Але тут роль книги далеко не головна. Тенденція збереження цілісності матеріальної структури книги з істотними обмеженнями видачі оригіналів виявляється по відношенню до рідкісних і цінних видань у спеціалізованих фондах бібліотек, а також по відношенню до так званих архівним примірників у складі їх загальних фондів, в колекціях місцевій пресі і т.д. В даний час усвідомлення необхідності створення на їх базі архівів друку, що документує національний репертуар.
Нормативно-правові акти закріплюють розвиваються в бібліотеках тенденції музейної та архівної використання книги, що дозволить здійснити великомасштабне збереження книжкового культурної спадщини, для якого на сьогоднішній день в суспільстві немає ні спеціальних музеїв ні архівів.
Ставиться завдання обов’язковій державній реєстрації книжкових пам’яток зі створенням державних реєстрів і склепінь за аналогією з нерухомими пам’ятками історії та культури. Це надає книжковим пам’ятників офіційний статус охоронюваного державою об'єкта з відповідними фінансовими та іншими гарантіями і формами протекціонізму.
Діяльність у відношенні рідкісних і цінних видань налічує десятиліття, але здійснюється кожною бібліотекою досить ізольовано і безсистемно, маючи на увазі як вертикальний ряд (тобто між регіональними та місцевими установами), так і горизонтальний — тобто між бібліотеками, архівами, музеями та іншими фондосховища.
Актуальною є задача організації цієї діяльності на засадах єдності та цілісності. Цілісність забезпечується: єдиним підходом до книжкових пам’ятників як культурної спадщини, що дозволяє здійснювати єдину політику щодо їх збереження і використання; єдиною системою обліку, що передбачає загальні принципи їх опису, ідентифікації і реєстрації; єдиною системою інформації як з метою контролю за збереженням книжкових пам’яток, так і з метою вивчення, популяризації та доступу; загальними вимогами до санітарним і технічним умовам утримання; державною гарантією підтримки збереження національної спадщини Україною.
Стандарти України визначають документальне національне науковий, культурний та історичну спадщину (ДНН) як сукупність документів, що входять до складу Архівного фонду та бібліотечних фондів України.
ДСТУ 33.004:2006 встановлює загальні вимоги до умов зберігання страхових копій документації, що є національним науковим, культурним та історичною спадщиною, до складу яких входять: мікроформи страхового фонду документації, страхові копії кінодокументів, фотодокументів, фонодокументів та відеодокументів.
Цей стандарт повинні застосовувати всі розташовані на території України суб'єкти господарської діяльності незалежно від їх організаційно-правової та відомчої належності, а також федеральні і територіальні органи виконавчої влади Російської Федерації, що беруть участь у проведенні робіт зі створення федерального та територіального страхових фондів документації.
Важливість проблем зберігання і охорони книжкових раритетів, які складають національну спадщину, спонукало ЮНЕСКО в жовтні 2003 р. Прийняти т.зв. Хартію про збереження цифрової спадщини.
У Хартії зокрема, йдеться: «Цифрове спадщина складається з унікальних ресурсів людських знань і форм вираження. Воно охоплює ресурси, пов’язані з області культури, освіти, науки та управління, а також інформацію технічного, правового, медичного та іншого характеру, які створюються у цифровій формі або переводяться в цифровий формат шляхом перетворення існуючих ресурсів на аналогових носіях. У випадку «цифрового походження» ресурси існують лише у вигляді цифрового оригіналу.
Цифрові матеріали включають в себе текстові документи, бази даних, нерухомі і рухомі зображення, звукові і графічні матеріали, програмне забезпечення та веб-сторінки, представлені в значному і безперервно зростаючому кількості форматів. Найчастіше ці матеріали фіксуються на короткий термін і вимагають прийняття цілеспрямованих заходів, спрямованих на їх створення, збереження та управління ними.
Багато з цих ресурсів мають неминущу цінність і значимість і, таким чином, представляють собою спадщину, яке необхідно зберегти і зберегти для нинішнього і майбутніх поколінь. Таке безперервно збільшується спадщина може існувати будь-якою мовою, в будь-якій частині світу і ставитися до будь-якій сфері людських знань і форм вираження «.
1.3 Наукова обробка документів як сукупність процесів аналізу і синтезу Головне завдання такої обробки — забезпечення швидкого доступу читача (користувача) до цікавить його документа.
Цей процес здійснюється в кілька етапів:
1) проводиться систематичний аналіз усіх наявних в базі даних документів. Цей аналіз передбачає ретельне вивчення первинного документа з метою складання короткого представлення про нього (анотація, реферат), виділення набору ключових слів, що складають предмет документа, а також індексацію документа прийнятими на Україні системами (УДК та ББК);
2) наступний етап — синтетичний, коли за результатами першого етапу складається бібліографічний опис первинного документа (продукується вторинний документ — інформаційне відображення первинного);
3) на третьому етапі з вторинних документів (бібліографічні описи, картки) складають каталог (алфавітний, предметний, систематичний);
4) четвертий етап — залучення інформаційно-пошукової системи для зв’язку читача (споживача) з цікавлять його первинним документом.
Автоматизація процесу пошуку документів у величезних масивах сучасних інформаційних центрів і бібліотек не позбавляє споживачів інформації від неприємностей, пов’язаних з інформаційним кризою. Парадоксально, але вона … тільки видозмінила його. Якщо до застосування автоматизованих ІПС споживач губився серед величезної маси непотрібної інформації, то ЕОМ звернула його увагу на потік, який максимально відповідає його потребам. Але, на жаль, інформації все ж занадто багато, щоб встигати переглядати її, залишаючи час хоча б для сну.
Інформаційний криза не була б принципово переборна взагалі, якщо б наукова інформація не володіла найважливішим властивістю — кумулятивно. Так, зміст наукової статті може бути коротко викладено в рефераті, багато розлогі висновки зведені до лаконічних математичних формул. Досягнення науки були б набагато скромніше, якщо б кожен учений не міг скористатися тими знаннями, які накопичені суспільством до нього, якби він відкривав закони природи заново. І оскільки скористатися цими знаннями, а отже, і внести в прогрес що-небудь нове неможливо без звернення до наукових документів, то кожне покоління вчених зайнято не тільки отриманням нових наукових даних, але і спеціальною роботою з систематизації, оцінки та узагальнення наукової інформації, яка і заснована на її кумулятивності.
Така робота заснована, з одного боку, на аналізі наукової інформації, з іншого — на синтезі нової інформації. Тому ця робота називається аналітико-синтетичної обробкою (АФО) інформації.
Витягти з документа його основний зміст, як це робиться при укладанні рефератів, узагальнити інформацію, що міститься в десятках публікацій в одному стислому огляді - ось завдання аналітико-синтетичної обробки наукових документів, вирішення яких дозволяє не тільки зменшити фізичний обсяг документів при збереженні їх основного змісту, але і синтезувати нову інформацію.
Поряд з автоматизацією процесів обробки документальної інформації велика увага приділяється і АСО: зростає кількість всіляких оглядів, каталогів, покажчиків, реферативних журналів, користування якими значно полегшує працю вчених і фахівців. Ці документи, створені в результаті аналітико-синтетичної обробки інших, називаються вторинними.
Деякі види вторинних видань можуть бути підготовлені автоматично (авторські, предметні покажчики і т.д.). Однак основною формою документа, що відображає результати аналізу і синтезу інформації, є огляд. Підготовка оглядів, у тому числі вищої їх форми — аналітичних оглядів, зрозуміло, під силу лише висококваліфікованим фахівцям. Існують і об'єднують їх зусилля організації, які виконують роботу з підготовки узагальненої науково-технічної інформації. Вони отримали назву центрів аналізу науково-технічної інформації.
На початку шістдесятих років у СРСР були створені інформаційні органи, які здійснювали аналітико-синтетичну переробку джерел інформації і готували на цій базі інформаційні видання, що містять фактографічні дані. В даний час понад 30% інформаційних органів підприємств групи машинобудівних галузей мають у своєму складі підрозділи аналізу та узагальнення інформації, укомплектовані фахівцями з тематики підприємства.
Підрозділи аналізу інформації успішно розвиваються, перш за все, у складі відділів НТІ великих головних інститутів, проте у ряді організацій такі підрозділи є самостійними відділами головних НТІ, які використовують фонди та довідковий апарат ОНТП.
Найбільш великі центри аналізу та узагальнення інформації діють у складі галузевих і підгалузеві інформаційних органів.
Діяльність центру аналізу інформації дозволяє керівництву приймати обгрунтовані управлінські рішення на інформаційній та економічній основі, істотно підвищувати рівень розробки планів — від річного до перспективного. Зовсім виняткове значення має ця діяльність для прогнозування розвитку галузі.
За кордоном також приділяється велика увага діяльності центрів аналізу та узагальнення інформації. Цікаво відзначити, що, за даними США, ефект від діяльності центрів аналізу інформації становить 4,2 долара на 1 долар витрат.
Отже, у міру наростання потоків наукової та технічної інформації людство робить все більш енергійних заходів, щоб уберегти світ від інформаційного хаосу. У результаті на сьогоднішній день споживач інформації має в своєму розпорядженні цілий арсенал засобів, що дозволяє йому ефективно орієнтуватися в потоках інформації. Про що з’явилися нових публікаціях по що цікавить його проблеми йому повідомить бюлетень сигнальної інформації. Ближче познайомитися з новинками він може, переглянувши реферативний журнал, причому якщо його цікавлять публікації певних авторів чи публікації по вузьких конкретних питань — до його послуг авторський, предметний і інші покажчики, звичайно прологом до журналу. Споживач може безпосередньо взаємодіяти з автоматизованою ІПС при пошуку як документальної, так і фактографічної інформації. Нарешті, досить цінну інформацію він почерпне з оглядових документів, підготовлених найбільш кваліфікованими фахівцями тієї галузі знань, в якій він працює. Якщо уявити собі споживача інформації зануреним у своєрідну «інформаційне середовище», з якої він черпає необхідну інформацію, то треба визнати, що в даний час вона стала для нього набагато більше «комфортної».
Проте, як відомо, «комфортність інформаційного середовища» вимагає від суспільства досить значних витрат. Чи можемо ми, наприклад, очікувати, що з будь-якого обраного нами тематичним напрямком ми обов’язково зустрінемо оглядовий документ? Звичайно, немає. Вторинні документи оглядового характеру повинні бути розраховані на широке коло споживачів і присвячені ключових питань науки і техніки.
Вибрати ці ключові питання, точно розрахувати сили і засоби для забезпечення максимального ефекту від аналітико-синтетичної обробки документів, як і від автоматизації обробки документальної інформації, можна тільки в тому випадку, якщо регулювати ці роботи в державному масштабі.
В Україні ці функції покладені на Державну систему науково-технічної інформації.
Розділ 2. Роль наукової обробки документів у сфері інформаційної діяльності
2.1 Індексування як вид інформаційної діяльності
Проблема інформаційного пошуку — одна з найважливіших проблем інформатики. Інформаційний пошук — це процес відшукання в якомусь безлічі документів тих, які присвячені зазначеної в інформаційному запиті темі (предмету) або містять необхідні споживачеві факти, відомості.
Інформаційний пошук здійснюється за допомогою інформаційно пошукових систем (ІПС) і виконується вручну або з використанням відповідних засобів механізації та автоматизації.
Інформаційно-пошукові системи можуть бути реалізовані за допомогою бібліографічної картотеки селектора, що містить перфокарти з крайової або внутрішньої перфорацією, ЕОМ і т.д. Для застосування ІПС необхідна систематизація та класифікація документів (етапи 1,2,3).
Однією з найпоширеніших класифікацій в даний час є універсальна десяткова класифікація (УДК), створена на основі десяткової класифікації М. Дьюї з ініціативи бельгійських вчених Поля Отле і Анрі Лафонтена. Всі знання, накопичені людством, розбиті в ній на 10 класів: 0. Загальний відділ; 1. Філософія; 2 Релігія; 3 Суспільні науки; 4 Вільний відділ; 5 Математика. Природничі науки; 6 Прикладні знання. Медицина. Техніка; 7 Спорт. Фотографія. Видовища, 8 Мовознавство. Філологія. Художня література. Літературознавство, 9 Краєзнавство. Географія. Біографія. Історія.
Кожен з цих 10 класів ділиться на 10 підкласів, потім ще на десять і т.д. Класифікація є ієрархічної (відношення, при якому один клас є підкласом іншого, більш широкого). Для позначення класів, підкласів в УДК застосовані арабські цифри, абсолютно однозначні для всіх людей, незалежно від їхньої мови або алфавіту. Ця класифікація на сьогоднішній день є міжнародною.
П. Отле і А. Лафонтен бачили в УДК лише засіб для досягнення досконалої системи організації знань. Їх основною ідеєю була геніальна здогадка про необхідність впорядкування всесвітньої системи наукової комунікації. Ця ідея і сьогодні залишається актуальною, оскільки цілі, вперше сформульовані П. Отле на рубежі нашого століття, та ідеї, що розвивалися їм аж до середини 40-х років, далеко ще не реалізовані й нині, а потреба у створенні більш досконалої системи наукової комунікації в людському суспільстві відчувається зараз значно гостріше, ніж у минулі десятиліття. Його почин у створенні універсальної десяткової класифікації послужив надійною основою для подальшої колективної розробки цієї класифікації.
Поряд з УДК, в Україні широко використовуються бібліотечно-бібліографічна класифікація (ББК), міжнародна класифікація винаходів (МКІ), класифікатори промислової продукції і т.д.
Широке поширення класифікацій пояснюється їх зручністю при інформаційному пошуку. Найпростіша Пошукова система являє собою каталог, організований за алфавітом, УДК чи за якоюсь іншою класифікації. У цьому випадку пошук здійснюється в масиві самих документів, представлених у вигляді каталожних карток. Після знаходження потрібної картки в каталозі подальший пошук зводиться до вилучення документа з полиці, де він зберігається. Здається, все просто і зручно. Дійсно, інформаційно-пошукові системи, організовані без застосування будь-яких засобів механізації пошуку, виправдовували себе протягом тривалого періоду.
Із зростанням потоків інформації різко збільшилися і обсяги каталогів. На пошук інформації стало йти значно більше часу, ніж колись. Поки величина масиву, в якому проводився пошук, не перевищувала кількох тисяч документів, миритися зі збільшенням часу пошуку було ще можна. Коли ж обсяг масивів став вимірюватися десятками тисяч документів, а в даний час у великих інформаційних органах такими цифрами вимірюється тільки щорічний приріст фондів, ручні методи пошуку, виявилися малопридатними.
Перші спроби зменшити час пошуку документів за допомогою механізації цього процесу відносяться до початку століття, коли з’явилися (1904 р.) карти з крайової перфорацією, що поклали початок застосуванню напівмеханізованими ІПС. У 1915 р. американський вчений Г. Тейлор отримав патент на спосіб пошуку інформації за допомогою так званих суперпозіціонних перфокарт. Однак практичне застосування ці перфокарти знайшли тільки в 1939 р. З тих пір перфокарти заслужили добру славу як вірні помічники людей в пошуку тієї чи іншої інформації.
Вже в середині 50-х років в СРСР була практично здійснена ідея використання перфораційних обчислювальних машин для пошуку документальної інформації.
Якщо на зорі розвитку обчислювальної техніки для інформаційного пошуку ефективніше було використовувати людей, навіть якщо для цього було потрібно їх все більше і більше, то незабаром положення круто змінилося. Погляди фахівців у галузі інформатики звернулися на ЕОМ. У інформаційному пошуку почалася ера автоматизації.
Механізація і особливо автоматизація бібліотечних та інформаційних процесів — це життєва необхідність. Слідуючи цій необхідності, в даний час у нашій країні і за кордоном розроблена велика кількість автоматизованих інформаційно-пошукових систем (АІПС). Зупинимося на описі таких систем докладніше.
Автоматизовані ІПС залежно від об'єктів пошуку можна розділити на дві групи: документальні і фактографічні.
Документальні системи обмежують свої цілі пошуком документів, фактографічні - пошуком найрізноманітніших числових характеристик, фактів, даних і т.д. Маючи багато спільного, ці типи ІПС володіють і рядом істотних відмінностей. У автоматизованих системах науково-технічної інформації найбільш широке застосування в нашій країні отримали документальні ІПС. Цей факт відображає провідне положення документа в процесі розповсюдження інформації.
Будь-яка документальна ІПС — від ручного до автоматизованої - включає наступні елементи: інформаційно-пошуковий мова (ІПМ), правила перекладу текстів документів і запитів з природної мови на ІПМ, формальні правила (алгоритми) пошуку, технічні пристрої, що реалізують алгоритми пошуку, фонд документів (або їх адрес), записаних на будь-яких носіях інформації.
2.2 Предметизація як вид інформаційної діяльності
Завданням предметизації є точне уявлення основного змісту документа у вигляді предметних рубрик (рядків).
Інакше ці рядки називаються дескрипторах.
Дескриптор (позднелат. descriptor, від лат. Describо — описую), лексична одиниця (слово, словосполучення) інформаційно-пошукової мови, що служить для опису основного смислового змісту документів. Дескриптори служать також для формулювання інформаційних запитів при пошуку документів в інформаційно-пошуковій системі.
Опис змісту документа за допомогою дескрипторів представляє собою пошуковий образ документа (ПІД), а опис змісту запиту — пошуковий образ запиту (ПОЗ). Правила складання пошукових образів документів і запитів є правилами перекладу текстів з природної мови на інформаційно-пошуковий мова (ІПМ).
Словник дескрипторів із зазначеними між ними смисловими відносинами, що охоплює певну галузь знання, називається інформаційно-пошуковим тезаурусом (ІПТ). Ідея застосування ІПТ для інформаційного пошуку документів складається в описі змісту документів і запитів за допомогою дескрипторів, що входять до його складу. На практиці ця ідея реалізується наступним чином. Текст документа, що вводиться в ІПС, зменшується до обсягу реферату, в якому виділяються слова, що несуть основну смислове навантаження, так звані ключові слова. За допомогою ключових слів досить точно передається зміст документа. Після цього кожне слово замінюється близьким йому за змістом дескриптором інформаційно-пошукового тезауруса.
Сукупність термінів тезауруса-дескрипторів, які замінили ключові слова, утворює пошуковий образ документа. Точно так само на язик дескрипторів перекладається і запит. Пошук документів після цього вже можна доручити машині. ЕОМ з притаманною їй швидкістю переглядає масиви подовий і порівнює їх з ПОЗом. Мета такого порівняння — виявити дескриптори, що належать одночасно поду і позу, тобто знайти перетин множин дескрипторів подав і поза. Чим більше зона перетину, тим точніше відповідність документа запиту. Мінімальна величина зони перетину обмовляється прийнятим критерієм смислового відповідності. Змінюючи його, можна варіювати точність і повноту пошуку в залежності від потреб споживачів інформації.
Такі принципи роботи ІПС з ІПМ дескрипторних типу. Якість їх роботи багато в чому залежить від досконалості застосовуваного інформаційно-пошукового тезауруса. Тому вимоги до ІПТ дуже високі. У ній не повинно бути, наприклад, термінів, що виражають одне і те ж поняття, тобто синонімів — це призвело б до втрат інформації при пошуку. Крім цього, повинні бути зафіксовані деякі відношення між термінами (рід — вид, частина ціле та інші), службовці цілям підвищення точності та повноти пошуку.
Тезаурус є необхідним лінгвістичним посібником будь-механізованої або автоматизованої інформаційно-пошукової системи, що використовує ІПМ дескрипторних типу.
Перші тезауруси, що задовольняють специфічним завданням інформаційного пошуку, були розроблені на початку 60-х років нашого століття.
Відповідно до тематичним профілем розрізняють багатогалузеві, галузеві і вузькотематичного тезауруси. Найбільш відомі з інформаційно-пошуковий тезаурус наступні:
1) тезаурус АСТІА (Агентство служби технічної інформації США) — 1-е видання в грудні 1962 р.;
2) тезаурус технічних і наукових термінів, найбільш великий з існуючих тезаурусом (23 364 слова, з яких 17 810 слів виступають в якості дескрипторів). Ця праця, що вийшов у світ в грудні 1967 р., представляє собою спільне видання Документального центру Міністерства оборони США та Об'єднаного ради інженерів;
3) тезаурус науково-технічних термінів за загальною редакцією Ю.І. Шемакіна (М., Військвидаві, 1972 р.). Цей тезаурус, що включає 19 000 термінів, з яких 15 000 є дескриптора, може служити прикладом вітчизняного багатогалузевого тезауруса.
До багатогалузевим тезаурусом можна віднести також тезауруси міжнародних інформаційних служб з атомної енергії. Тезаурус Євратому, виданий в 1966 і 1967 рр. і Тезаурус Міжнародного агентства з атомної енергії у Відні («ІНІС"-Тезаурус), 6-е видання якого вийшло у світ в 1974 р.
Прикладами тезаурусом галузевого масштабу можуть служити: словник дескрипторів з хімії та хімічної промисловості, виданий НІІТЕХІМ в 1973 р. (1033 дескриптора, 5373 ключових слова), тезаурус дескрипторів за освітою, який використовується в автоматизованій системі Інформаційного центру в галузі народної освіти США (1967 р.).
Навіть цей невеликий перелік може дати уявлення про те, наскільки велика роль інформаційно-пошуковий тезаурус у пошуку інформації. В даний час в усьому світі ведеться інтенсивна робота з побудови ІПТ різного призначення.
Для з'єднання «слів» Тезаурус в «фрази» застосовуються граматичні засоби ІПМ — правила складання пошукових образів за допомогою дескрипторів ІПТ. Граматики, що застосовуються в ІПМ, бувають найрізноманітнішими. Одні регламентують порядок дескрипторів в подах і позах, інші - приписують кожному дескриптор числа, що характеризують їх значимість для пошукового образу, треті - вказують на роль кожного дескриптора за допомогою спеціальних покажчиків і т.д. Застосування граматичних засобів в деяких випадках дозволяє більш точно передавати зміст документів і тим самим покращувати пошукові характери ІПС.
Детальне освітлення класифікаційних і дескрипторних ІПМ, інформаційно-пошуковий тезаурус і лінгвістичних (тобто мовних) аспектів автоматизованих ІПС пояснюється тим, що вони надають вирішальний вплив на функціонування ІПС. Якою б потужною і сучасної ЕОМ ми ні в своєму розпорядженні, без правильно обраного пошукової мови вся система буде працювати неефективно.
Удосконалення ІПМ багато в чому залежить від досягненні в галузі теорії семантичної інформації і напрямків лінгвістики. Тому поява автоматизованих ІПС послужило поштовхом до інтенсивних досліджень в області цих наук. Дуже заманливо, наприклад, доручити обчислювальної машині таку трудомістку операцію, як реферування документів. Одним із способів реалізації цієї ідеї є виділення машиною в тексті таких пропозицій, які містять найбільш значущі для даної галузі знань терміни (а такими є дескриптори тезауруса цій галузі знань, який зберігається в пам’яті машини). З цих пропозицій формується реферат документа.
2.3 Анотування і реферування як вид інформаційної діяльності
Анотація (від лат. Annotatio — зауваження) — коротка характеристика видання: рукописи, монографії, статті чи книги. Анотація показує відмінні риси та гідності видаваного твори, допомагає читачам зорієнтуватися в їх виборі.
Мета анотації - проінформувати читачів про існування роботи (тексту) певного змісту та характеру. Обсяг анотації зазвичай коливається від 150 до 200 знаків (слів).
За обсягом розрізняють короткі і розгорнуті анотації.
З точки зору методу аналізу та оцінки тексту (першоджерела) розрізняють описові (розкривають тематику без критичної оцінки), рекомендаційні (оцінюють придатність тексту для даної категорії читачів) та довідкові анотації (з критичними зауваженнями).
Приступати до написання анотації можна лише тоді, коли відомо:
— КОМУ? (Кому адресована анотація),
— Про що? (Про що в анотації говориться),
— НАВІЩО? (З якою метою написана анотація (проінформувати, переконати прочитати та ін));
Реферала (нім. referat, від лат. Refere — доповідати, повідомляти) — письмовий доповідь або виступ з певної теми, в яких узагальнюється інформація з одного або декількох джерел.
Реферати можуть бути викладом змісту наукової роботи, художньої книги і т.п.
Види рефератів.
Розрізняють два види рефератів: продуктивні і репродуктивні. Репродуктивний реферат відтворює зміст первинного тексту. Продуктивний містить творче або критичне осмислення реферованому джерела.
Репродуктивні реферати можна розділити ще на два види: реферат-конспект і реферат-резюме. Реферат-конспект містить фактичну інформацію в узагальненому вигляді, ілюстрований матеріал, різні відомості про методи дослідження, результати дослідження та можливості їх застосування. Реферат-резюме містить тільки основні положення даної теми.
У продуктивних рефератах виділяють реферат-доповідь і реферат-огляд. Реферат-огляд складається на основі кількох джерел і зіставляє різні точки зору з даного питання. У рефераті-доповіді, поряд з аналізом інформації першоджерела, є об'єктивна оцінка проблеми; цей реферат має розгорнутий характер.
Реферат має певну композицію:
Вступ. У вступі обгрунтовується вибір теми, можуть бути дані вихідні дані реферованому тексту (назва, де опубліковано, в якому році), повідомлені відомості про автора (П.І.Б., спеціальність, вчений ступінь, вчене звання), розкривається проблематика обраної теми.
Основна частина. Зміст реферованому тексту, наводяться основні тези, вони аргументуються.
Висновок. Робиться загальний висновок з проблеми, заявленої в рефераті.
Реферат має наступні ознаки:
1) зміст реферату повністю залежить від змісту реферованому джерела;
2) містить точний виклад основної інформації без спотворень і суб'єктивних оцінок;
3) має постійні структури.
Реферати пишуться зазвичай стандартним, клішірованним мовою, з використанням типологізувати мовних зворотів на кшталт «важливе значення має», «приділяється особлива увага», «піднімається питання», «робимо наступні висновки», «досліджувана проблема», «освітлюваний питання» і т. п. До мовних і стилістичним особливостям рефератів відносяться слова і звороти мови, що носять узагальнюючий характер, словесні кліше. Їм, як правило, притаманні невизначено-особисті пропозиції, абстрактні іменники, специфічні і наукові терміни, властиві досліджуваної проблеми, слова-жаргонізми, дієприслівникові і причетні обороти. У рефератів особлива логічність подачі матеріалу і висловлювання думки, певна об'єктивність викладу матеріалу. Все це пов’язано не з бідністю на лексики автора, а зі своєрідністю мови рефератів (особливо вузькоспеціалізованої спрямованості, де переважають жаргонізми, специфічні терміни та обороти).
У завершенні реферату робота повинна отримати відповідну рецензію з оцінкою. Рецензія складається на основі наступних чинників:
1) рівень ерудованості автора по вивченій темі (сучасність і своєчасність розглянутої проблеми, ступінь знайомства автора роботи з актуальним станом вивчається проблематики, повнота цитування джерел, ступінь використання в роботі результатів досліджень і встановлених наукових фактів);
2) особисті заслуги автора реферату (додаткові знання, використані при написанні роботи, які отримані крім запропонованої освітньої програми, новизна поданого матеріалу і розглянутої проблеми, рівень володіння тематикою та наукове значення досліджуваного питання);
3) характер реферату (логічність подачі матеріалу, грамотність автора, правильне оформлення роботи, належне відповідність реферату всім стандартним вимогам).
ВИСНОВКИ На основі викладеного приходимо до висновків:
Аналітико-синтетичні засоби обробки інформації вирішують проблему неухильного зростання обсягу інформації. Перспективи розвитку інформаційних галузей науки дають змогу сподіватись, що у майбутньому національна спадщина минулого разом з документообсягом сучасності не загубиться у морі інформації й надалі буде служити людству.
Додатки А. Фонди України У контексті національної спадщини має сенс обмежити обговорення музейними, архівними та бібліотечними фондами.
Суспільні відносини у галузі музейної справи регулює Закон України «Про музеї та музейну справу».
Музейний фонд України — це сукупність рухомих пам’яток природи, матеріальної і духовної культури, що мають художнє, історичне, етнографічне та наукове значення (далі - пам’ятки), незалежно від їх виду, місця створення і форм власності, що зберігаються на території України, а також нерухомих пам’яток, які знаходяться в музеях України і враховані в порядку, визначеному Законом «Про музеї та музейну справу».
До Музейного фонду України можуть належати також пам’ятки, що знаходяться за межами України і згідно з міжнародними договорами підлягають поверненню в Україну.
Музейний фонд України складається з державної і недержавної частин.
До державної частини Музейного фонду України належать музейні зібрання та окремі пам’ятки, що є державною власністю. Музейні колекції та музейні предмети, які знаходяться в музеях, переданих із державної власності в комунальну власність, є державною власністю і належать до державної частини Музейного фонду України. При передачі музеїв державної форми власності у комунальну власність музейні колекції та музейні предмети залишаються у державній власності і належать до державної частини Музейного фонду України. Порядок віднесення музейних колекцій та музейних предметів, а також окремих пам’яток до державної частини Музейного фонду України визначається Положенням про Музейний фонд України. Контроль за станом обліку, збереження, використання та переміщення державної частини Музейного фонду України здійснюється Міністерством культури і мистецтв України. Перелік музеїв (в тому числі музеїв системи Національної академії наук України, Українського товариства охорони пам’яток історії та культури, Педагогічного товариства України, інших самоврядних організацій), в яких зберігаються музейні колекції та музейні предмети, що є державною власністю і належать до державної частини Музейного фонду України, затверджується Кабінетом Міністрів України.
До недержавної частини Музейного фонду України належать музейні колекції та музейні предмети, які не віднесені або не підлягають віднесенню до державної частини Музейного фонду України, в тому числі пам’ятки, що є власністю громадських та релігійних організацій, окремих громадян та їх об'єднань.
Музейні колекції та музейні предмети, віднесені до державної частини Музейного фонду України, не підлягають відчуженню за винятком обміну на інші музейні колекції та музейні предмети. Рішення про обмін музейних колекцій та музейних предметів, які належать до державної частини Музейного фонду України, приймається Міністерством культури і мистецтв України.
Музейний фонд України є національним багатством України, невід'ємною складовою частиною культурної спадщини України, яке охороняється законом. Положення про Музейний фонд України затверджується Кабінетом Міністрів України.
Відносини, пов’язані з формуванням, обліком, зберіганням і використанням Національного архівного фонду, та інші основні питання архівної справи регулює Закон України «Про Національний архівний фонд та архівні установи».
Національний архівний фонд України є складовою частиною вітчизняного та світової культурної спадщини та інформаційних ресурсів суспільства, перебуває під охороною держави і призначений для задоволення інформаційних потреб суспільства і держави, реалізації прав і законних інтересів кожної людини. Документи Національного архівного фонду є культурними цінностями, які постійно зберігаються на території України або відповідно до міжнародних договорів, згода на обов’язковість яких надана Верховною Радою України, підлягають поверненню в Україну. Юридичні та фізичні особи зобов’язані забезпечувати збереження Національного архівного фонду та сприяти його поповненню.
Національний архівний фонд формується в порядку, встановленому Законом «Про Національний архівний фонд та архівні установи» [23], з архівних документів органів державної влади, органів місцевого самоврядування, підприємств, установ і організацій усіх форм власності, а також архівних документів громадян і їх об'єднань. Держава вживає заходів для поповнення Національного архівного фонду документами культурної спадщини України, які перебувають за кордоном, та документами іноземного походження, які стосуються історії України, у пріоритетному порядку фінансує їх виявлення, взяття на облік, повернення, придбання або відтворення в копіях. Централізований облік зазначених документів ведеться у порядку, встановленому центральним органом виконавчої влади у сфері архівної справи і діловодства.
Державну реєстрацію документів Національного архівного фонду здійснюють центральний орган виконавчої влади у сфері архівної справи і діловодства та уповноважені ним архівні установи. Порядок реєстрації і форма реєстраційного свідоцтва затверджуються Кабінетом Міністрів України.
Документи Національного архівного фонду підлягають обов’язковому державному обліку, який ведеться в порядку, встановленому центральним органом виконавчої влади у сфері архівної справи і діловодства. Архівні установи, які здійснюють повноваження власника, юридичні та фізичні особи, у власності яких знаходяться документи Національного архівного фонду, зобов’язані дотримуватись встановленого порядку ведення їх обліку.
Статус бібліотек, правові та організаційні засади діяльності бібліотек і бібліотечної справи в Україні визначає Закон України «Про бібліотеки і бібліотечну справу».
Бібліотечні фонди формуються відповідно до значення, складу користувачів бібліотеки та виду бібліотеки як упорядковане зібрання документів.
Державний бібліотечний фонд України складається з фондів бібліотек, що перебувають у державній і комунальній власності, фондів бібліотек самоврядних організацій, взаємопов'язаних скооперуватися комплектуванням, єдиним довідково-пошуковим апаратом, системою депозитарного зберігання, перерозподілу та взаімопользованія фондів, і відображає науковий, культурний, інформаційний потенціал суспільства.
Особливо цінні, рідкісні документи та колекції включаються до Державного реєстру національного культурного надбання України відповідно до положення, яке затверджується Кабінетом Міністрів України.
Б. Архів. Державний архів друку Книжкової палати Державне наукова установа «Книжкова палата України імені Івана Федорова» — фактично основний фонд друкованої продукції, виданої в нашій країні з 1917 року.
Історія Книжкової палати нерозривно пов’язана з історією розвитку видавничої справи та бібліографії України. Це наукова структура, яка займається не тільки каталогізацією, систематизацією та розробкою методичних принципів державної бібліографії, а й роботою міждержавного рівня.
Книжкова палата — унікальне установа, в якій зберігаються газети, журнали, плакати, книги та інші друковані матеріали, видані на території України, починаючи з 1917 року. З 1939 року в книжкову палату почали надходити матеріали Західної України, а з 1954 року — матеріали Криму. Книжкова палата — найбільше сховище друкованої продукції України. Тут зібрано понад 13 мільйонів одиниць зберігання.
Другий за величиною бібліотеці країни — Національній бібліотеці ім. Вернадського, яка також є одержувачем обов’язкового примірника, то, на жаль, велика пожежа 1964 забрав «життя» 250 тисяч книг. Згоріла, в основному, «україніка». Тому сьогодні Книжкова палата — єдиний державний архів, що має повне зібрання друкованої продукції України.
Діяльність Книжкової палати забезпечує інформування суспільства про випущеної видавничої продукції через систему державної бібліографії. Кожен місяць Книжкова палата друкує так звані літописи — державні бібліографічні покажчики різних друкованих видань, наприклад, ведемо Літопис книг — це перелік всіх книг, що вийшли на території України за місяць. Щомісяця до Книжкової палати надходить близько ста книжок, кожну з яких потрібно обробити і внести в літопис.
Як наукова установа Книжкова палата випускає журнал під назвою «Вісник Книжкової палати», віднесений ВАК України до наукових видань, проводить наукові дослідження, вивчає книгу, веде електронний каталог усіх книжок, виданих за роки незалежності (він доступний усім дослідникам).
Фонд Книжкової палати унікальний ще й тим, що тут зберігається 32-тисячна колекція заборонених у СРСР книжок.
Заборонених з різних причин. Наприклад, виїхав автор за кордон і став «неблагонадежен» або у виданні міститься інформація, що закликає до повалення тодішнього ладу чи відверто критикує його. У цьому фонді є твори Миколи Зерова і книжки, які він редагував, становив, і навіть ті, для яких писав вступні статті; збірки казок та оповідань Оксани Іваненко; твори Олеся Донченка; Олександра Дорошкевича; п’ять видань підручника «Історія української літератури»; матеріали з'їзду письменників України за 1927 рік і маса іншої літератури. Це справді унікальний фонд.
Історія Книжкової палати України — це історія самої України. Незважаючи на перебування нашої країни у складі радянських соціалістичних республік, палата зуміла зберегти свою національну унікальність, тому що його фонди поповнювалися лише тією літературою, яка видавалася на території України. У той час як у національній бібліотеці ім. Вернадського та інших Національних бібліотеках цей матеріал зберігається в сукупності з матеріалами, які надходили з усіх республік Радянського Союзу. Фонди Книжкової палати — це національну спадщину, документальна пам’ять України.
В. Старі книги. Раритети За попередніми даними, в бібліотеках України зберігається понад 2 млн. книжкових раритетів. Цілком можливо, що їх набагато більше, і це без урахування аналогічних книг в музеях і архівах, букіністичних магазинах, приватних бібліотеках. Зведеного в межах держави списку або хоча б достовірного сумарного їх обліку не існує до цих пір. Створення Державного реєстру культурного надбання України, його частини — «Книжкові раритети України» — проголошено пріоритетним завданням у державній «Програму збереження бібліотечних та архівних фондів на 2000;2005 рр.», Затвердженої Кабінетом Міністрів України. Час, відведений на це, проходить, а реєстру як не було, так і немає. І далеко не другорядну роль тут відіграє відсутність належним чином підготовлених фахівців для роботи з рукописними книгами, стародруками, рідкісними та цінними виданнями. Жоден вуз країни їх не готує.
У створенні реєстру книжкових раритетів України повинні брати участь усі установи-фондоутримувачі, неодмінно на основі єдиної програми, що спирається на новітні інформаційні технології, вимоги міжнародних стандартів до бібліографічного опису даних видів документів. Реєстр не може включати описи, зроблені колись від руки нашими попередниками в кожній бібліотеці за своїми традиціями. Крім того, правильність опису сьогодні неодмінно треба перевіряти de visu. Це досить складне завдання, і вирішити її можна тільки спільними зусиллями фахівців, яких ще потрібно відповідно підготувати. Їм необхідні, безумовно, знання стародавніх мов, історії книги, бібліографічного опису стародруків та рідкісних видань, вміння працювати на комп’ютері з базами даних та багато іншого.