Допомога у написанні освітніх робіт...
Допоможемо швидко та з гарантією якості!

Форматы баз даних в автоматизованих бібліографічних системах

РефератДопомога в написанніДізнатися вартістьмоєї роботи

Другий блок є основним й найбільш складним. У ньому, власне, і відбувається конвертування даних. Це конвертування теж можна розділити сталася на кілька состовных частин. Спочатку перебудувати маркер. Після доведеться конвертування довідника. Тут буде важливим перевести все мітки полів, подполей і індикаторів, які збігаються. Це можна вирішити з допомогою додаткового файла, у якому зазначено все… Читати ще >

Форматы баз даних в автоматизованих бібліографічних системах (реферат, курсова, диплом, контрольна)

Термін MARC є акроним назви системи MachineReadable Catalogue or Cataloguing (Машиночитаемый каталог чи каталогізація). Але це назва ні точно, оскільки MARC не є під жодним виглядом каталогу, ні методом каталогізації. Фактично MARCце короткий і зручний термін для позначення процесу маркування будь-якій частині каталогизационной записи те щоб вона була б оброблена з допомогою компьютера.

У загальних словах, комунікативний формат MARC повинен обеспечивать:

возможность його застосування всім видів бібліотечних документов;

достаточную гнучкість на вирішення різноманітних завдань на додаток до каталогизации;

удобство застосування у різних автоматизованих системах.

Застосування стандарту MARC у бібліотеці, яка доти працювала з каталожными картками, помітно збільшить швидкість роботи, тобто нічого очікувати необхідності стояти «бозна скільки часу «у каталогу, щоб знайти потрібну картку. Стандарт MARC дозволяє знайти будь-яку книжку, що є у бібліотеці, за лічені секунди. Наприклад, якщо читач забув або знає якогоабо потрібного описи книжки (автор, назва тощо. п), то MARC дає можливість знайти цієї книжки по ключовим словами. До переваг MARC-а слід зарахувати те, що він потребує один комп’ютер, тобто всі ті каталоги з картками стають ненужными.

Використання стандарту MARC запобігає дублювання праці та допомагає бібліотекам краще розпорядиться бібліотечними ресурсами. Вибір для роботи формату MARC дає бібліотекам можливість купувати надійні каталогизационные дані, представлені у правильної форме.

Застосування стандарту MARC при управлінні бібліотечними операціями дозволяє бібліотекарям вживати наявні автоматизовані бібліотечні системи. Багато системи, доступні бібліотекам різного рівня, спроектовані до роботи з форматом MARC. Вони технічно обслуговуються і вдосконалюються, отже бібліотеки можуть користуватися перевагами останніх набутків у комп’ютерної технології. Стандарт MARC дозволяє також бібліотекам замінити одну систему в іншу впевнено, що й дані будуть совместимы.

Попри співробітництво країн цій галузі є кілька версій формату MARC як-от UKMARC, INTERMARC, USMARC, розбіжність у яких були викликані відмінностями в національних правила і практиці каталогизации.

ГЛАВА 1. ОПИС ФОРМАТУ USMARC.

Бібліотека Конгресу є офіційним депозитарієм публікацій Сполучених Штатів і первинним джерелом каталогизационных записів для міжнародних публікацій, і публікацій США. У 60-ті рр. Бібліотека Конгресу розробила формат MARC Бібліотеки Конгресу (формат LC MARC), систему, яка використовує в каталогизационной записи цифри, букви і інші символи для позначення різних типів інформації. У процесі розвитку формат LC MARC став форматом USMARC (форматом MARC США). Ведення бібліографічного формату USMARC, як і офіційної документації USMARC, здійснюється Бібліотекою Конгресса.

1.1 ТЕРМІНИ USMARC ТА ЇХНІ ОПРЕДЕЛЕНИЯ.

Покажчики даних (Signposts): Щоб зчитувати й інтерпретувати бібліографічну запис, комп’ютера необхідна допомогу. Таблиця 1 ілюструє інформацію, для позначення якої потрібні «signposts » .

Таблиця 1.

Запис з текстовими «signposts »: Така сама запис з знаками MARC:

| «SIGNPOSTS «|ДАНІ | «SIGNPOSTS «|ДАНІ | |Заголовок | |100 |King, Stephen | |основний | |1 $а| | |библиографическ|King, Stephen | | | |ой записи: | | | | |Ім'я: | | | | |Заглавие і | |245 |Misery | |відомостей про | |10 $а | | |ответственности|Misery | | | |: | | |Jim Arnosky | |Основне |Jim Arnosky |$з | | |заголовок: | | | | |Дані про | | | | |відповідальності| | | | |: | | | | |Область | |250 |1 st ed. | |видання: |1 st ed. |$а | | |Дані про | | | | |виданні: | | | |.

й дуже далее…

Порівняння одному й тому ж запису із текстовими «signposts «і з знаками USMARC ілюструє компактність формату USMARC, тобто ощадливе витрачання обсягу комп’ютерної памяти.

Таблиця 1 ілюструє запис MARC, розмічену «signposts ». Найменуваннями цих «signposts «є: ПОЛІ, МІТКА, ІНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ І ВИЗНАЧНИК СОДЕРЖАНИЯ. Розглянемо ці терміни в отдельности.

Поле: Кожна бібліографічна запис логічно ділиться на поля. Є полі для автора, полі для інформації про заголовку тощо. Ці поля поділяються одне чи кілька «подполей » .

Як відзначалося раніше, текстові найменування полів надто тривалі, щоб їх забезпечувати кожного запису USMARC. Натомість поля видаються 3-х цифровими метками.

Мітка: Кожне полі асоціюється з трёхцифровым числом, яке називається міткою. Мітка ідентифікує полі (тип даних), яке слід після неї. Навіть якщо екрані дисплея відразу після мітки виведені ще й індикатори (в такий спосіб, може з’явитися число з 4 чи 5 цифр), мітка завжди є перші три цифры.

Див. нижче приклад записи поля. Кількість 100 є міткою, визначальною полі заголовка основний бібліографічною записи з ім'ям особи (автора).

|100 1# $a King, Stephen|.

У записи USMARC 10% міток використовують досить, інші 90% зустрічаються лише у рідкісних случаях.

Індикатори: За кожної міткою поля йдуть дві позиції символів (за винятком полів 001- 009). Одна чи обидві ці позиції символів можуть використовуватися для індикаторів. У деяких полях вживається лише перша чи другу позицію; за іншими полях використовуються обидві позиції; а таких полях, як 020 чи 300, позиції не використовуються зовсім. Якщо позиція індикатора немає, індикатор характеризується як «невизначений », позиція залишається незаповненою. У цьому роботі, в прикладах, незаповнені чи невизначені позиції індикатора позначаються символом «# » .

Значенням кожного індикатора є цифра від 0 до 9. (Хоча правилами допускаються літери, їх використовують рідко). Навіть, якщо два індикатора разом можуть здаватися 2-х значным числом, насправді є двома окремими цифрами. У наведеному нижче прикладі перші 3 цифри є міткою (245 визначає полі заголовка), 2 такі цифри (1 і 4) є значеннями індикаторів. «1 «- перший індикатор; «4 «- другий индикатор.

|24 514 $a The waste lands / $з adapted from Stephen | |King. |.

Значення 1 першого індикатора на полі заголовка вказує, що в каталозі мусить бути окрема бібліографічна запис на заголовок. У картковому каталозі це, що з одиниці описи повинна распечатываться картка з додаткової бібліографічною записом на заголовок, а довідці про додаткових записах має бути вказано «Заглавие » .

З допомогою другого індикатора на екрані дисплея вказується кількість символів на початку поля (включаючи прогалини (spaces)), котрі мають враховуватися комп’ютером у процесі сортування і розстановки. Для заголовка The waste lands другий індикатор встановлюється на цифрі «4 », щоб перші чотири символу («T », «h », «e », прогалину) не враховувалися при сортуванню і заголовок сортировалось в файлі слову «waste » .

Подполе: Більшість полів містить кілька окремих взаємозалежних даних. Кожен тип даних на полі називається подполем, і кожному подполю передує код подполя. Поля від 001 до 009 немає подполей.

Наприклад, полі фізичного описи для книжок (певний міткою 300) включає подполе для обсягу (кількість сторінок), подполе й інших фізичних характеристик (інформація про ілюстраціях), і навіть подполе для розмірів (сантиметры):

|300 ## $a 675 p.; $b ill.; $з 24| |див. |.

Код подполя: Код подполя є ще однією букву нижнього регістру (у випадках цифру), якої передує роздільник подполя. Кожен код подполя вказує, якому типу даних слід після него.

Роздільник: Різні програми математичного забезпечення для уявлення роздільника на екрані чи роздруківці використовують різні символи. Прикладами можуть бути подвійний кинджал ((), знак «ет «(@), знак долара ($), лінія подчёркивания (_) та інші. У цьому роботі у ролі частини коду подполя, що є роздільником, використовується знак долара ($).

У наведеному вище прикладі кодами подполей є: $a для позначення обсягу, $b й інших фізичних характеристик і $з для размера.

1.2. КОМУНІКАТИВНИЙ ФОРМАТ USMARC.

Записи USMARC називають «теговыми «записами (записі розмови з знаками). Перш ніж стати теговой записом, запис USMARC (в так званому комунікативному форматі USMARC) виглядає за цілком інакшим, — як одне довше злите пропозицію. Комунікативний формат USMARC складається з маркера і довідника. У комунікативному форматі мітки перед полями не проставляються. Проте, безпосередньо за маркером слід блок даних, званих довідником. Цей довідник показує, які мітки є у запису і де їх розташовуються. Довідник формується (комп'ютером) з бібліографічною записи.

Маркер: Маркер є перші 24 (від 0 до 23) символу записи. Кожна позиція має встановлений значення. Розглянемо більш докладно значення позицій маркера :

00- 04 ДОВЖИНА ЛОГІЧНОГО ЗАПИСИ;

05 СТАТУС ЗАПИСИ:

a = підвищення рівня кодирования;

з = виправлена чи пересмотренная;

d = исключённая;

n = новая;

p = підвищення рівня кодирования;

06 ТИП ЗАПИСИ:

a = мовної материал;

b = контролю над архівними і рукописными.

материалами;

з = друковане музичне издание;

d = рукописний музичний материал;

e = друковане картографічне издание;

f = рукописний картографічний материал;

g = проекційний материал;

і = немузична звукозапись;

j = музична звукозапись;

k = двомірна непроекционная графика;

m = комп’ютерний файл;

o = комплексна работа;

r = тривимірний объект;

07 БІБЛІОГРАФІЧНИЙ УРОВЕНЬ:

a = складова частина монографічного издания;

b = складова частина серіального издания;

з = подборка;

d = частина подборки;

m = монографія як одиниця описания;

p.s = серіальне издание;

08- 09 НЕВИЗНАЧЕНІ ПОЗИЦИИ.

10 РАХУНОК ІНДИКАТОРІВ (завжди «2 »).

11 РАХУНОК КОДА ПОДПОЛЯ (завжди «2 »).

12- 16 БАЗОВИЙ АДРЕС ДАНИХ (вычисляется.

комп’ютером кожної записи).

17 РІВЕНЬ КОДИРОВАНИЯ:

# = повний уровень;

1 = повний рівень, аналіз матеріалу не проводится;

2 = менш повний рівень, аналіз матеріалу не.

проводится;

5 = частковий (попередній) уровень;

7 = мінімальний уровень;

8 = допубликационный рівень (CIP);

u = неизвестно;

z = не применяется;

18 ФОРМА ОПИСОВОЇ КАТАЛОГИЗАЦИИ:

# = відповідає ISBN;

а = AACR2;

і = ISBN;

u = неизвестно;

19 ВИМОГИ До ПОВ’ЯЗАНОЇ ЗАПИСИ:

# = взаємопов'язана запис НЕ потрібно (для полной.

обробки составляемой записи);

r = взаємопов'язана запис потрібно (для полной.

обробки составляемой записи);

20 ДОВЖИНА КОМПОНЕНТА «ДОВЖИНА ПОЛЯ ДАНИХ «.

(завжди «4 »).

21 ДОВЖИНА КОМПОНЕНТА «ПОЗИЦИЯ НАЧАЛЬНОГО.

СИМВОЛУ «(завжди «5 »).

22 ДОВЖИНА КОМПОНЕНТА «ЧАСТИНА, ОПРЕДЕЛЯЕМАЯ.

ПРИ ЗАСТОСУВАННІ «(завжди «0 »).

23 НЕОПРЕДЕЛЁННАЯ ПОЗИЦИЯ СИМВОЛУ ПЛАНА.

ДОВІДНИКА (завжди «0 »).

Довідник :Як було зазначено раніше, довідник показує, які мітки є у запису і де їх розташовуються. Це досягається з допомогою підрахунку символів у бік позиції, де починається кожне полі. Для більш наочного уявлення розглянемо приклад комунікативної записи USMARC:

00422dam 22 001 337 450 000 500 170 000 006 842 537 001 280 584 747 581 440 1 400 044 245 007 200 108 045 656 035 895 705 071 761 422 280 928 729 759 744 2 200 266^19970806174944.800$a519.200$a519 $xЮ 16 $hП^ 0 $aЮди зв М.Д.^ 0 $aСходимость розподілів і сум випадкових величин$ bУчебн.метод.пособие^ 0 $aМн.$bУниверситетское00$a254 c.$bил.00 $aТеория ймовірності, Статистичні дослідження, Прикладн, а математика, Випадкові величины00$b2 $e2 $v2 $t77 $z0 $j2^(.

Проаналізуємо цей пример.

Перші 24 позиції є маркером. Він закінчується цифрами «4500 ». Відразу після маркера починається довідник. Мітки у цьому прикладі підкреслені. Кожна окрема стаття довідника разом із міткою має довжину 12 символів. Першої міткою є 005. Наступні 4 позиції після кожної мітки вказують довжину поля. У цьому записи дані на полі 005 (дата коригування) мають довжину 17 символів. Наступні 5 позицій позначають початкову точку відліку (позицію початкового символу) при цьому поля була в рядку даних, яка слід за довідником (після першого роздільника «^ «).

Поле 005 починається з позиції 0 (перша позиція є позицією 0). Наступною є мітка поля 008, що має довжину 10 символів і починається з 17-ї позиції (довжина попереднього поля 17, додана для її початковій позиції 0, дорівнює 17). Наступна мітка поля- 090. Вона має довжину 17 символів і з 27-ой позиції (17+10=27)…

Останнє полі 990 має довжину 22 символу і з 266 позиции.

Роздільники полів (в прикладі вони зображені знаком ^) відзначають кінець довідника і поклала край кожного поля, що випливають за справочником.

Роздільник записи (изображённый у цьому прикладі знаком () закінчує кожну бібліографічну запись.

Наведемо, нарешті, цей приклад як размеченного изображения:

Маркер… 00422dam 22 001 337 4500.

DTLT (дата та палестинці час останньої транзакции)…005…19 970 806 174 944.8.

Индекс УДК…080…$ a 519.2.

Шрифты…09 0…$a 519.

… …$x Ю 16.

… …$h П Имя автора…100… …$a Юдін М. Д.

Заглавие… 245…$a Відповідність распределений.

випадкових величин.

… …$b Учебн.метод.пособие Публикация…260. …$a Мн.

… …$b Университетское Физическое описание…300…$a 254 с.

… …$b ил.

Ключевые слова …653…$a Теорія ймовірності, Статистические.

дослідження, Прикладна математика,.

Випадкові величины Данные про заказе…990…$b 2.

… …$e 2.

… …$v 2.

… …$t 77.

… …$z 0.

… …$j 2.

ГЛАВА 2. ФОРМАТ UNIMARC.

2.1. МЕТИ СТВОРЕННЯ ФОРМАТУ UNIMARC.

З початку 1970;х років сімейство MARC збільшилася більш ніж на 20 форматів. Відмінність змісті даних цих форматів викликають необхідність редагування записи до обміну ими.

Для подолання несумісності форматів прийнято рішення розробити міжнародний формат MARC (UNIMARC), який дозволило б приймати записи, складені під час будь-якому форматі MARC те щоб їм було запропоновано конвертуватися в UNIMARC, та якщо з нього на будь-який інший формат MARC. І тому кожної національної службі достатньо скласти лише дві програми (одну для конвертування в UNIMARC, іншу з формату UNIMARC) замість спеціальних програм конвертування у кожний із форматів MARC, наприклад, INTERMARC в UKMARC, USMARC в UKMARC тощо. Отже, основна мета створення формату UNIMARC є сприяння міжнародному обміну даними в машиночитаемой формі між національними бібліографічними службами, а зустрічалися з більш просте та зручне складання описи бібліографічних одиниць, їх пошук і освоєння контроль. Останнє досягається з допомогою розроблених методів записи бібліографічною інформації, здійснюваної згідно до міжнародних стандартами.

2.2. ВІДМІННІСТЬ ФОРМАТУ UNIMARC ВІД ФОРМАТА.

USMARC.

Насамперед необхідно відзначити, що визначення, що існували для формату USMARC підходять (чи правильніше сказати застосовуються) в форматі UNIMARC (тобто поняття поля, мітки, індикатора, маркера, довідника і ін. зберігаються). Отже, втрачає сенс описувати так само докладно формат UNIMARC, як було описаний формат USMARC. Тому слід зупинитися за тими фрагментах, які відрізняють ці дві формата.

Основною відмінністю пива форматів UNIMARC і USMARC є передусім невідповідності полів, подполей, індикаторів тощо. (тобто правильніше буде сказати невідповідності міток полів, подполей, індикаторів тощо. п.). До відмінностям можна назвати також і те, що його полів в форматі UNIMARC не збігаються з кількістю полів в форматі USMARC, причому у UNIMARC полів більше, аніж USMARC. Це з тим, що сама формат UNIMARC, як було зазначено сказано раніше, створювався значно пізніше, ніж формат USMARC і, відповідно, під час створення UNIMARC враховувалося все, щоб ця формат був є і замінив й інші форматы.

Подальші розбіжності між форматами UNIMARC і USMARC є як дрібними (що випливають із перелічених вище) і пов’язані знову таки про те, що формат UNIMARC «молодший «формату USMARC (наприклад, кількість подполей в полях, довжини полів, розбіжності у позначеннях індикаторів і другое).

Наведемо, нарешті, приклад записи комунікативного формату UNIMARC і можна порівняти його приклад записи коммуникотивного формату USMARC:

00579nam 2 200 193 45 000 010 011 000 002 855 998 460 152 174 199 439 360 1 000 800 070 200 006 851 160 364 812 063 187 319 569 935 268 590 164 901 888 61 000 580 022 467 503 680 538 916 882 503 656 997 807 596 404 786 851 741 696 3 702 002 600 359^ru96−37 586^ $a5−88 201−040−3^ $a19970708d1996 u a0rusb0103 ca0 $arus1 $aInternet Windows95 $fПитер Кент$g Переклад з анг. У. Л. Григор'єва^ $aM.$cКомпьютер$d1996^ $ a367 c.$cил.$d21 см1 $aКомпьютерный світ 21 века0 $aВычисл ительные мережі глобальные-операционные системи^ $a681.324/.0 66(100)$zrus^ $a50 $drugasnti^ $a32.97 $drubbk^ 1 $aКент$bПитер ^ 1 $aГригорьев$bВ. Л.^(.

Почнемо сіло, перші 24 позиції є маркером. Аналогічно з записом USMARC, після маркера слід довідник. Мітки в довіднику підкреслені кожна стаття довідника займає 12 символів (4 позиції на довжину поля і п’яти позицій на точку отсчёта).

Якщо уважно подивитися, неважко помітити, що мітки полів в UNIMARC від міток в USMARC (наприклад, полі автора в UNIMARC-200, а USMARC-100). Також видно, що повторюється полі 686. Це засвідчує тому, що поля була в UNIMARC можуть повторюватися. Понад те, в UNIMARC послідовність приведення полів у запису є вільною, тобто поля необов’язково повинні йти у довіднику гаразд возростания (001, 010, 100, 200 тощо.), можуть располагатся вільно (605, 710, 702, 012 і т.д.).

Остальные особливості записи формату UNIMARC наведені у початку пункту 2.2.

2.3. КОНВЕРТУВАННЯ ДАНИХ ПО СТРУКТУРЕ.

USMARC (UNIMARC.

Під час створення конверторів USMARC (UNIMARC необхідно скласти певні алгоритми программ.

Розглянемо алгоритм программы-конвертора UNIMARC (USMARC.

Программа-конвертор може складатися зі 3 блоков.

У першому блоці программа-конвертор повинна зчитувати ті дані з файла, які потрібно конвертировать.

Другий блок є основним й найбільш складним. У ньому, власне, і відбувається конвертування даних. Це конвертування теж можна розділити сталася на кілька состовных частин. Спочатку перебудувати маркер. Після доведеться конвертування довідника. Тут буде важливим перевести все мітки полів, подполей і індикаторів, які збігаються. Це можна вирішити з допомогою додаткового файла, у якому зазначено все мітки полів, подполей і індикаторів однієї з форматів. Також треба враховуватиме й те, що довжини полів формату, який конвертується можуть збігатися з довжинами полів нового формату (тобто треба перелічити ці длины).

У блоці нову запис необхідно записати у новий файл, який і відображатиме форму записи нового формата.

Алгоритм конвертора USMARC (UNIMARC будується аналогічним образом.

ЗАКЛЮЧЕНИЕ

.

Отже, ми провели невеличкий огляд по форматам автоматизованих бібліографічних систем USMARC і UNIMARC (оскільки саме ця два формату мають найбільшого поширення і довіра до в мире).

Основна мета цього дослідження полягала над детальному розгляді форматів USMARC і UNIMARC, суть у тому, аби підкреслити факт переходу бібліотек для цієї автоматизовані системы.

Хотілося б зазначити і те, що як краще є формат записи UNIMARC, ніж USMARC (чи ще який-небудь). Причини цього називалися раніше. Можна сміливо сказати що формат UNIMARC вже витісняє формат USMARC, і потім він (UNIMARC) стане форматом, які у більшості країн світу. Проте наука абсолютно не слід за місці, і, можливо, вже у незабаром з’явиться зручніший формат.

Показати весь текст
Заповнити форму поточною роботою