D O K U M E N T U M A Z O N O S Í T Ó F á j l n é v : kalcso_gyula_born_digital.jpg B é l y e g k é p : https://dka.oszk.hu/079800/079890/kalcso_gyula_born_digital_kiskep.jpg F ő c í m : Bevezetés B e s o r o l á s i c í m : Bevezetés E g y é b c í m : Born Digital Műhelykonferencia M i n ő s í t ő : alcím S z e r e p : létrehozó B e s o r o l á s i n é v : Kalcsó U t ó n é v : Gyula I n v e r t á l a n d ó n é v : N E g y é b n é v e l e m e k : Dr. E s e m é n y : felvéve I d ő p o n t : 2022-01-12 E s e m é n y : elérhető I d ő p o n t : 2021-11-05 D á t u m r a v o n a t k o z ó m e g j e g y z é s : Az előadás időpontja. A t í p u s n e v e : prezentáció A t í p u s n e v e : előadás M e g n e v e z é s : Prezentáció M e g n e v e z é s : Könyvtártudomány - prezentáció M e g n e v e z é s : Petőfi Irodalmi Múzeum A j o g t u l a j d o n o s n e v e : Dr. Kalcsó Gyula S z e r z ő i j o g i m e g j e g y z é s e k : Jogvédett T é m a k ö r : Könyvtártan, információtudomány A l t é m a k ö r : Elektronikus szöveg és könyvtár T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Internetes technológia T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Internet használat T á r g y s z ó : digitális technika M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : digitálisan készült dokumentum M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : tartalom M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : tartalomszolgáltatás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : tárolás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : archivált példány M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : gyűjtemény M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : 2021 M i n ő s í t ő : időszak K é p a l á í r á s : Bevezetés N y e r s v a g y O C R - e s s z ö v e g : BEVEZETÉS
Dr. Kalcsó Gyula
Petőfi Irodalmi Múzeum
Digitális Bölcsészeti Központ
VÁZLAT
Definíció
Tipológia
Problémák
Koncepció
Kitekintés
1. MI A BORN DIGITAL?
BORN DIGITAL - AZAZ DIGITÁLISAN SZÜLETETT
Olyan digitális objektum, amelynek nincs analóg előzménye, és nem is készíthető pontos analóg másolat róla (de nem feltétlenül digital exclusive!).
Objektum: lehet egy vagy több fájl és/vagy könyvtár halmaza.
2. MILYEN BORN DIGITAL OBJEKTUMOK VANNAK?
SZÁMÍTÓGÉPES KORSZAK ELŐTTI ÉS UTÁNI
Moldován István (OSZK)
Könyv, Könyvtár, Könyvtáros 2018/10: http://ki2.oszk.hu/3k/2018/12/a-digitalisan-szuletett-tartalmak-megorzese1/
Elsősorban a számítógépes korszak előtt is létező dokumentumtípusoknak megfelelő digitális tartalmak (e-könyvek, e-folyóiratok, egyéb e-kiadványok) kezeléséről szól (az OSZK ebben ért el eredményeket).
2007-től: OSZK Digitális könyvtár e-könyvek kötelespéldányainak fogadására (http://oszkdk.oszk.hu/)
L. még: MEK, EPA, DKA
BORN DIGITAL OBJEKTUMOK
A digitális objektumok (!) lehetnek szövegek, álló- és mozgóképek, hanganyagok, adatbázisok, adathalmazok, 3D objektumok és a felsoroltak konténerei. (Bánki-Kómár: Fehér könyv 1.0, 123.)
BORN DIGITAL OBJEKTUMOK
Digitális fotók
Digitális dokumentumok
"Learatott" webes tartalom
Digitális "kéziratok"
Elektronikus "rekordok" (beleérti az e-mailt vagy a prezentációkat is)
Statikus adathalmazok
Dinamikus adathalmazok (beleérti a közösségi médiát és a CAD-ot is)
Digitális műalkotások
Digitális médiatartalmak
BORN DIGITAL OBJEKTUMOK
Szöveges objektumok
Képek
Audiovizuális tartalmak
Webes tartalom (bármilyen formátumú mentett objektum, beleértve a közösségimédia-exportot is)
E-mail
Adathalmazok, adatbázisok (akár egyszerű táblázatok)
Szoftverek és kiegészítőik (akár működő rendszerek)
A fentiek keveréke (!) - a born digital általában komplex
3. A BORN DIGITAL MEGŐRZÉS PROBLÉMÁI
BORN DIGITAL OBJEKTUMOK
AZ ÖRÖKKÉVALÓSÁGNAK?
A kezelésükkel kapcsolatos problémák a digitális létmódjukból adódnak: a nagy mennyiség, a heterogenitás, a gyors elavulás és az értelmezhetőség fenntartása jelentik a legnagyobb kihívást.
Hogyan garantálható a born digital objektumok integritása?
Hogyan kezelhető a tömegességük?
Hogyan garantálható a hosszú távú felhasználhatóságuk?
Hogyan lehet elavult digitális objektumokat megőrizni és szolgáltatni?
Hogyan őrizhetők meg a kontextuális információik?
FÁJLINTEGRITÁS: CHECKSUM (FIXITY)
ADATHORDOZÓK, MŰKÖDŐ RENDSZEREK
FRED (Forensic Recovery of Evidence Device)
TÖMEGES FELDOLGOZÁS: AUTOMATIZÁCIÓ
HOSSZÚ TÁVÚ MEGŐRZÉSI FORMÁTUMOK
A KONTEXTUS PROBLÉMÁJA: KÖZÖSSÉGI MÉDIA
MIT ŐRZÜNK MEG VÉGÜL?
4. A DBK KONCEPCIÓJA
OPEN ARCHIVAL INFORMATION SYSTEM REFERENCIAMODELL
A 2012-es Magenta Book -> ISO-szabvány (14721:2012)
Magas szintű elméleti modell a digitális környezetben keletkező adat/információ hosszú távú megőrzésére.
MSZ ISO 14721
Űradat- és információközvetítő rendszerek. Nyílt Archívumi Információs Rendszer (OAIS). Referenciamodell
A Magyar Szabványügyi Testület MSZT/MB 508 "Információ és dokumentáció" nemzeti szabványosító műszaki bizottsága megkezdte a honosítást.
A bizottság elnöke Dancs Szabolcs (OSZK), helyettese Bilicsi Erika (MTAK), titkára Csík Gabriella főosztályvezető-helyettes.
CSOMAGOK
A digitális megőrzés (Digital Preservation) kulcsfontosságú tevékenységei
Ingest = bejuttatás/bevitel ~ befogadás/átvétel/gyarapítás
Preservation, Administration = megőrzés, adminisztráció
Access = hozzáférés
Különféle információs csomagokat ír elő
Submission Information Package (SIP) = átadás/átvétel
Archival Information Package (AIP) = megőrzés, adminisztráció
Dissemination Information Package (DIP) = szolgáltatás
Előírja azt is, hogy milyen típusú metaadatokat kell az információs csomagoknak tartalmazniuk.
AZ ARCHIVAL INFORMATION PACKAGE (AIP) FELÉPÍTÉSE ÉS METAADATAI
CSOMAGOK: BAGIT
BAGIT-CSOMAGSZERKEZET
CSOMAGOK: E-ARK
STRUKTURÁLIS METAADATOK (METS)
A Library of Congress és a Digital Library Federation által felügyelt nyílt szabvány a digitális objektumok leíró, technikai, adminisztrációs és szerkezeti metaadatainak XML formátumban való tárolására.
Nagy előnye, hogy rugalmasan módosítható, bővíthető a legkülönbözőbb gyűjtemények és dokumentumtípusok jellemzőihez, és hogy a szerkezeti metaadatoknál az összetartozó fájlok közötti kapcsolatok, sorrendek és hierarchiák is leírhatók vele.
ADMINISZTRATÍV METAADATOK (PREMIS)
Az említett szabványok és ajánlások honosításában és magyarországi bevezetésében a PIM DBK Humáninformatikai Csoportja az OSZK-val együttműködésben, az RDA-munkacsoport keretében közreműködik: https://pim.hu/hu/digitalis-bolcseszeti-kozpont/ajanlasok.
BitCurator
Előfeldolgozás, "adattriage"
"Törvényszéki" lemezképkészítés (biztonságos bitszintű másolat)
Fájlrendszerelemzés és -jelentés készítése (validáció, hasonlósági jelentés, vírus- és malware-ellenőrzés, duplumszűrés stb.)
Érzékeny adatok kiszűrése
Technikai és egyéb metaadatok előállítása
SIP-csomag készítése stb.
OAIS-KOMPATIBILIS REPOZITÓRIUMOK
Legyen képes SIP-csomagot fogadni, abból AIP- és DIP-csomagot előállítani.
Legyen képes az ezekhez szükséges műveletek elvégzésére, vagy legalább alkalmassá lehessen erre tenni.
Tudja kezelni a METS-et, a PREMIS-t, valamint tetszőleges metaadatsémát, továbbá OAI-PMH-kompatibilis legyen.
Legyen API-ja, testreszabható legyen.
Összakapcsolható legyen más rendszerekkel.
Lehetőleg nyílt forráskódú és ingyenes legyen.
A PIM BORN DIGITAL WORKFLOW-JA
(MOHAY ANIKÓ)
KITEKINTÉS
FELDOLGOZÁS ÉS SZOLGÁLTATÁS
PÉLDA: A RUSHDIE-ARCHÍVUM
DHUPLA-ARCHITEKTÚRA (MIHÁLY ESZTER)
AMIT ELÉRTÜNK
Kidolgoztunk egy részletes ajánlást a born digital kezelésére, amely része a dHUpla-rendszertervnek.
Fut a BitCurator a PIM szerverén.
Elkezdődött az adattári e-mail-archiválás (és kezdeményeztük a fotótári elindulását is).
Részt veszünk az OAIS, valamint más szabványok honosításában és bevezetésében (METS, PREMIS).
Részt veszünk nemzetközi szabványok és ajánlások kidolgozásában (MailBag).
Követjük az AI világának fejleményeit, részt veszünk konzorciumi munkálatokban (MI Koalíció).
Beszerzés alatt van egy FRED.
Együttműködünk más intézményekkel.
Előadásokat, workshopokat tartottunk a témában (pl. NWS).
"Who controls the past controls the future. Who controls the present controls the past." George Orwell, 1984.
KÖSZÖNÖM A FIGYELMET!
Dr. Kalcsó Gyula
kalcso.gyula@dbk.pim.hu D o k u m e n t u m n y e l v e : magyar K a p c s o l ó d ó d o k u m e n t u m n e v e : Hortobágyi Ágoston: "Hiteles" adat nélkül nincs mesterséges intelligencia A f o r m á t u m n e v e : PowerPoint prezentáció O l d a l a k s z á m a : 43 T e c h n i k a i m e g j e g y z é s : Microsoft Office PowerPoint 2016 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : PDF dokumentum O l d a l a k s z á m a : 43 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : HTML dokumentum T e c h n i k a i m e g j e g y z é s : HTML 5 verzió M e t a a d a t a d o k u m e n t u m b a n : N L e g j o b b f o r m á t u m : JPEG képállomány L e g n a g y o b b k é p m é r e t : 770x433 pixel L e g j o b b f e l b o n t á s : 96 DPI S z í n : színes T ö m ö r í t é s m i n ő s é g e : közepesen tömörített Á l t a l á n o s m e g j e g y z é s : Born digital - Műhelykonferencia, 2021 A z a d a t r e k o r d s t á t u s z a : KÉSZ S z e r e p / m i n ő s é g : katalogizálás A f e l d o l g o z ó n e v e : Nagy Zsuzsanna |