Szolgáltatásfejlesztés, adatbázisépítés együttműködéssel
Burmeister Erzsébet (erzsi@marki.lib.uni-miskolc.hu)
Bevezetés – a szolgáltatás története
A MATARKA (Magyar Folyóiratok Tartalomjegyzékeinek Kereshető Adatbázisa: www.matarka.hu) immár három éves. Fejlesztése 2002 januárjában kezdődött egy 2001-es Nemzeti Kulturális Örökség Minisztériumánál elnyert pályázati támogatás segítségével. A Miskolci Egyetem Könyvtára kapott ekkor egymillió forintot 15
magyar műszaki folyóirat 10 évfolyamának feldolgozására. A két fejlesztő három,
már akkor is széles körben elterjedt szabad szoftver együttesét választotta: a
MySQL relációs adatbázis-kezelőt, PHP HTML ágyazott parancsnyelvet és az APACHE
Web kiszolgálót. Februárban 12 könyvtáros kolléganő már szorgalmasan vitte is
be az adatokat, hogy a pályázattal el lehessen határidőre számolni. Az akkori
felületre már nem is igen emlékszünk, a szerzői és cím kulcsszó indexet
lehetett böngészni, az adatbázist alig használta még valaki, bár már elérhetővé
vált, hisz el volt rejtve a könyvtár szerverén egy hosszú URL mögött.
A pályázat lezárásával az
elkezdett munka nem szakadt meg. Megszerettük és folytattuk. Újabb NKÖM
pályázat következett és most már a KATALIST könyvtárosi levelező listán
megszervezett 8 tagú, különböző nagyságú könyvtárakból alakult együttműködés
kapott 2,5 millió forintot a további munkához. A feldolgozott folyóiratok száma
97-re bővült. 2002 őszén hatalmas ütemben kezdett növekedni az adatbázis, ami
azóta sem állt le. Természetesen a fejlesztés is folytatódott, egyre újabb
lehetőségeket építettünk be, teljes egészében megújult a beviteli felület, a
lekérdező felület. Több módon lehetséges a használat: az adatbázis kereshető
szerző és cím kulcsszó szerint, a szerzői és kulcsszó index tanulmányozható a
névváltozatok jobb áttekintése végett. És természetesen a tartalomjegyzékek
folyóirat számonként böngészhetők. Mind a közvetlen kereséssel kapott találati
listákból, mind a szám szerint böngészett tartalomjegyzékekből el lehet jutni a
teljes szövegekhez, amennyiben azok valahol léteznek az interneten és az
ugrópontok bekerültek az adatbázisba. Teljes szöveg a címek mintegy tíz
százalékánál érhető el. Keresés előtt szűkítések állíthatók be: kiadási év tól‑ig
formában, 8 szakterületre és egyenként folyóiratokra szűkítés, valamint kérhető
az is, hogy csak a teljes szövegekhez elvezető ill. csak az Elektronikus
Periodika Archívumban /EPA-ról később még részletesen szó lesz/ megtalálható
cikkek jelenjenek meg. A szűkítések szükségesek voltak, mert a feldolgozott
folyóiratok sokféle szakterületet fednek le, ezért egy-egy keresés rengeteg nem
releváns találatot is eredményezhet a felhasználónak. De ha a keresés előtt
bejelöli pl. a nyelvészet szakterületet, akkor csak a számára érdekes
nyelvészeti szakcikkek jelennek meg a listában.
2003 elején a szolgáltatásnak saját nevet adtunk és saját domain nevet kértünk /MATARKA/, ami a használatot nagyon fellendítette. Azóta statisztikát is vezetünk a keresésekről. A letárolt keresések visszacsatolásként sok új ötletet adtak a keresési módszerek átalakítására, módosítására: alkalmazkodni kellett az interneten elterjedt általános felhasználói keresési szokásokhoz, vagyis hogy a kevésbé tapasztalt felhasználók nem ismerik a könyvtárosok számára nyilvánvalónak tűnő, Boole algebrára épülő találati halmazok egyesítésére, ill. metszetére épülő keresési stratégiákat, az átlagos felhasználó csak kereső szavakat tud egymás mellé írni. A többség számára a csonkolás is ismeretlen fogalom, arra sem gondol, hogy egy adatbázisba nem kerül be a szerzők neve elé a dr., ifj., id.
Az adatbázis építése
Kézi adatbevitel böngésző
segítségével: Az adatbázis biztonsága érdekében minden könyvtár
felhasználói névvel és jelszóval rendelkezik a belépéshez és csak adatbeviteli,
-módosítási és -törlési műveletek elvégzésére van jogosultsága. Az adatbázis
rendszergazdája a Miskolci Egyetem könyvtárának dolgozója. Az adatbevitel a
nyomtatott folyóirat számainak kézbevételével űrlapok kitöltésével történik. Az
adatbeviteli munkát szabályzat rögzíti.
Kézi
adatbevitel egyszerű szövegszerkesztővel: A könyvtár vagy folyóirat
szerkesztőség a MATARKA_formatum szabályzat szerint veszi fel a
tartalomjegyzékeket és a kész fájlokat e‑mailben elküldi az Miskolci Egyetem
munkatársainak, akik az erre a célra kifejlesztett program segítségével a
tartalomjegyzéket az adatbázisba bekonvertálják.
Már meglevő,
interneten megtalálható tartalomjegyzékek átalakítása és konvertálása:
Amennyiben valamely könyvtár vagy maga a folyóirat szerkesztőség rendszeresen
közzéteszi honlapján a tartalomjegyzékeket, azok onnan aránylag kevés munkával
leszedhetők és egyszerű szövegszerkesztővel konvertálható formátummá
átalakíthatók, akkor egy-egy szám bevitelének ideje lecsökken, hiszen nincs
kézi adatbevitelre szükség, csak a szerkesztési és a konvertálási műveletsor
elvégzésére.
Együttműködés a konzorciumon belül
Az első két sikeres pályázat után a résztvevők száma tovább
bővült, újabb tagok jelentkeztek.
Mivel azonban az utóbbi években a
pályázatkiírók kimondottan csak új szolgáltatások létrehozását támogatták, célzottan
az adatbázis továbbfejlesztésére és továbbépítésére nem lehetett pályázatot
benyújtani és sajnos más jellegű benyújtott pályázataink sem nyertek. A
szolgáltatás további fenntartása érdekében szükségesnek látszott együttműködési
szerződés kötése és konzorcium alakítása.
A konzorcium 2004-ben alakult az alapító könyvtárakból és csatlakozott könyvtárakból. Idézet az együttműködési szerződésből, amely július 1-én lépett életbe.
A könyvtárak vállalják, hogy az általuk feldolgozott folyóiratok
(részletes és pontos listák minden egyes könyvtár esetén az együttműködési
nyilatkozatban felsorolva) tartalomjegyzékeit adatbázisba beviszik, a munkában
résztvevő munkatársak az adatbázis építésével kapcsolatos tevékenységeket
(elsősorban adatbevitel, de esetenként együttműködés a folyóirat
szerkesztőségekkel) folyamatosan végzik. A nyilatkozatot a könyvtárak vezetői,
nem önálló könyvtárak esetében a fenntartói írják alá az intézmény pecséttel
ellátott céges papírján. Az együttműködési nyilatkozatok a szerződés
mellékleteit képezik. A könyvtárak a feldolgozott folyóiratok listáját évente
felülvizsgálják, ha változások történnek (valamely folyóirat megszűnik, adott
folyóirat feldolgozását már nem tudják vállalni, újat szeretnének hozzávenni,
stb.), akkor új együttműködési nyilatkozatot küldenek az Miskolci Egyetem
Könyvtár Levéltár Múzeumnak, aki a konzorcium tagjait erről értesíti, és
szükség esetén gondoskodik a szóbanforgó folyóiratok feldolgozásának további
módjáról.
2005 elején a konzorciumot alakító könyvtárak listája (a könyvtár neve mellett a feldolgozott folyóiratok száma).
A tagok a kapcsolatot egymással
e-mailen keresztül tartják. Van egy tarka-l nevű, a Miskolci Egyetem által
működtetett levelező lista. A résztvevők először 2002 szeptemberében találkoztak
Budapesten a beinduló közös munka részleteinek megbeszélésére és megismerkedés
végett. 2004 tavaszán ismét Budapesten tartottunk találkozót.
Együttműködés az Elektronikus Periodika Archívummal
Az Országos Széchenyi Könyvtár MEK osztályán belül működik az Elektronikus Periodika Archívum /EPA/.
Az EPA célja: nyilvános hozzáférésű, magyar vagy magyar vonatkozású, tudományos és kulturális témájú elektronikus folyóiratok, magazinok, újságok és hírlevelek teljes szövegű archiválása és a magyar vonatkozású elektronikus időszaki kiadványok lelőhely és forrás-nyilvántartása.
A Miskolci Egyetem Könyvtár, Levéltár, Múzeum és az OSZK 2004 februárjában együttműködési megállapodást kötött /Februárban a MATARKA konzorcium hivatalosan még nem létezett./ Részlet az együttműködési megállapodásból:
Az EPA és MATARKA együttműködése mind a két fél számára hasznos, mert a
közös folyóiratok szerző és cím szerint kereshetővé válnak (EPA számára
előnyös), a teljes szövegek megbízható ugrópontokra vezetnek és nincs szükség a
konvertálásnál nagyobb munkaráfordítást igénylő kézi adatbevitelre (MATARKA
számára előnyös).
Az EPA vállalta, hogy munkatársai
a MATARKA-t mindig értesítik egy újabb folyóirat archiválásáról, illetve a
közös folyóiratok újabb számairól és honlapján a közös folyóiratok MATARKA-n
keresztül működő keresőjét működteti, így a MATARKA-nak további nyilvánosságot
biztosít. Az együttműködés kezdetén ez azt jelentette, hogy a MATARKA mindig
e-mailben kapott az EPA munkatársától értesítést, ha egy új számot dolgoztak
fel Mára az értesítés automatikusan generálódik, vagyis az emberi feledékenység
ki van zárva.
A MATARKA vállalta, hogy- az összes EPA-ba kerülő és a gyűjtőkörébe illeszkedő folyóirat tartalomjegyzékét konvertáló módszere segítségével átveszi és az archivált teljes szövegű cikkeket belinkeli. Ez a MATARKA - szempontjából előnyös, mert az EPA garantálja a cikkek elérhetőségét. Az EPA munkatársai a közös folyóiratok listáját mindig naprakészen látják.
Együttműködés folyóirat szerkesztőségekkel
A MATARKA böngészhető oldalait, vagyis magukat a tartalomjegyzékeket az intelligens kereső robotok /Google/ fel tudják tárni, annak ellenére, hogy azok nem statikus HTML oldalakon léteznek, hanem minden alkalommal a lekérdezéskor generálódnak. Ennek eredményeképp a cikkek a Google-ban való kereséskor is előjönnek a találatok között. Ez a tény hozzájárult ahhoz, hogy a szolgáltatás különösebben sok propaganda nélkül aránylag ismertté vált. Ezért a folyóiratok számára is kedvező, ha tartalomjegyzékeik feldolgozásra kerülnek, mert ezáltal ismertségük nő. Ez a magyarázata annak, hogy sok folyóirat szerkesztőséggel alakult már ki kapcsolatunk, akik tartalomjegyzékeiket konvertálásra alkalmas formátumban Miskolcra e-mailban elküldik. Szerkesztőségek esetében csak ezt a beviteli formát alkalmazzuk. A szerkesztőségeket vagy mi kerestük meg felkéréssel, vagy ők fordulnak hozzánk azzal, hogy szeretnének az adatbázisba bekerülni. Két folyóiratot már el is kellett utasítanunk, mert szakterületük nem illett a mieink közé.
Szerkesztőségek küldik az alábbi
folyóiratok tartalomjegyzékét.
Az előbbiek alapján világosan
látszik, hogy a szolgáltatás további bővítésének legígéretesebb módja további
szerkesztőségek bevonása. Számukra egy-két folyóiratuk havi, kéthavi vagy
negyedéves számainak tartalomjegyzékét elkészíteni és nekünk elküldeni nem
igazán időigényes feladat. Különösen akkor nem, ha a tartalomjegyzék valamilyen
számítógépes formátumban amúgy is létezik, és ez ma már szinte természetes. Esetünkben
igaz tehát a mondás: sok kicsi sokra megy. Sok ember kevés munkájából
EGYÜTTMŰKÖDÉS-sel komoly és jól használható adatbázis épül.
Tervezett együttműködés az EPA-val és LibInfo-val
2004-ben az EPA, a LibInfo (az
OSZK szolgáltatása) és a MATARKA tervezte, hogy közös GVOP pályázatot ad be, a
pályázat el is készült, de a túl magas kötelező önrész miatt az OSZK nem
vállalta a benyújtást. A megvalósítandó merész és újszerű tervek egyike az lett
volna, hogy a MATARKA-ban a teljes szöveggel el nem érhető cikkeknél a
felhasználó a kívánt cikk fénymásolatát SMS-en keresztül történő fizetéssel
megrendelhette volna a folyóiratért felelős könyvtártól, a beszkennelt cikket
e-mail címére kapta volna meg, illetve adott honlapról letölthette volna. Talán
lesz még egyszer ebből is valami….
Néhány statisztikai
adat (2005 február 6.)
A statisztikák a honlapról is
elérhetők mindig.
Adatbázis nagysága
Folyóiratok száma: 274
Cikkek száma: 182893
Szerzős cikkek száma: 138111
Szerzők száma: 47416
Nem üres címsorok száma:178955
URL-ek száma: 18265
Látogatók száma 2004-ben:
|
Hónap |
Keresés |
Böngészés |
Tallózás |
Összesen |
|
Január |
5358 |
3137 |
690 |
9185 |
|
Február |
8402 |
3875 |
1195 |
13472 |
|
Március |
10206 |
3069 |
1404 |
14679 |
|
Április |
9546 |
2077 |
1139 |
12762 |
|
Május |
6205 |
2381 |
1144 |
9730 |
|
Június |
4133 |
2407 |
557 |
7097 |
|
Július |
2798 |
1949 |
461 |
5208 |
|
Augusztus |
2648 |
2644 |
542 |
5834 |
|
Szeptember |
7495 |
4023 |
1071 |
12589 |
|
Október |
12810 |
5726 |
1609 |
20145 |
|
November |
15213 |
4303 |
1706 |
21222 |
|
December |
10342 |
4093 |
1072 |
15507 |
|
2004 összesen |
94929 |
39637 |
12556 |
147122 |