Számítógépes listák bevitele a BME Publikációs Adattárba vagy
a Magyar Tudományos Művek Tárába

A hagyományos módon (pl. Word-ben, TeX-ben, stb.)[1] összeállított publikációs listák emberi szemlélő számára általában egyértelműek. Ez azt jelenti, hogy az információ bennük van, mindössze a számítógépet is meg kell tanítani arra, hogy ezt az információt kinyerje. Ha tehát megfelelő programot használunk, a publikációs lista átalakítható mezőkre (pl. szerzők, cím, oldalszám tól-ig, év) bontott adatokká, ebből például RIS formátumú [1] [2] állomány készíthető, és ez a BME PA-ba beolvasható.

Az is kézenfekvő, hogy ugyanakkor a listák egy része az olvasó számára sem teljesen egyértelmű, így a számítógép-program sem képes mindig jól dönteni, mi a pontos felbontás. A megoldás az, hogy ilyenkor segítünk a számítógépnek. A Word/TXT/TEX forrásállomány kézi kiegészítése, javítása sokkal egyszerűbb és gyorsabb, mint a RIS állomány javítása, vagy az adatbázisba beolvasott adatok konverziója. A javasolt eljárás tehát a következő:

ˇ         ha szöveges állományunk van, tisztítás (pl. LaTeX parancsok törlése, vagy a PDF-ből másolt szövegből a felesleges sortörések törlése)

ˇ         az állomány kiegészítése a könnyen fel nem ismerhető információkkal (például típus, oldalszámnál pp., konferencia városánál <CL>, stb., lásd lejjebb), a kódolás javítása (például a hullámos/kalapos ő és kalapos ű betűk nem jók)

ˇ         átalakítás RIS állománnyá – erre szolgál a publex program [2]

ˇ         a RIS állomány kézi ellenőrzése (ettől egyáltalán nem kell félni, minden logikus és egyszerű, az egyes mezőket [nagybetű][nagybetű][szóköz][szóköz]-[szóköz] jelzi a sor elején, a címet a TI előzi meg, a szerzőt az AU, stb.)

ˇ         beolvasás a BME PA-ba

ˇ         az esetleges fennmaradó hibák javítása kézzel

Alap-információk

Az egyszerűség kedvéért kezdjük egy publikációs lista példával:

Kis János publikációs listája

TY  - JOUR
Nagy István, Kis János: Információs rendszerek tervezése. Journal of Information, Vol. 6, No. 3, pp. 35-38, 2002.

TY  - JOUR
Nagy István, Kis János: Információs rendszerek tervezése II. Journal of information, 6(4), pp. 45-68, (2002), <SN> 1234-567X

TY  - CONF
Kis J; Nagy I: "Design of information systems". <CT>Proceedings of WEC'2003, <CL>Montreal, <CC>Canada, <Y2>June 12-14 2003, pp. 5-8.

TY  - CHAP
Kis, János: This is a book chapter. pp. 256-289. <ED>Taylor K, <BT>Title. <PB>Publisher, <CY>Budapest, 2004. <PG>255, <SN>ISBN 345 678 567

TY  - BOOK
Taylor, K: Book title. <PB>Publisher, <CY>Budapest, 2004. 255 p. Egyetemi jegyzet, <L1>http://www.mit.bme.hu/~valaki/cikkek/cikk.pdf

Például a fenti tartalmú word állomány RIS formára konvertálva ilyen lesz.

Vigyázat!

A típus felismerése kritikus: ez adja meg a BME PA-ba beolvasott közlemény típusbesorolását. Elvben sokszor felismerhető, hiszen:.

ˇ         Egyrészt a Word file-ok általában csoportosítva vannak, kb. ilyen alcímekkel: Folyóiratcikkek, Konferenciacikkek, Könyvek és könyvfejezetek. Ez önmagában sokat segíthet.

ˇ         A publex program felismer bizonyos alapvető jellemzőket (kulcsszavak: conference, symposium, Tagung, colloquium, workshop, meeting, chapter, thesis, stb.; oldalszám tól-ig).

ˇ         Ennek ellenére, mivel a publikáció leírásában lehetnek félrevezető szavak (pl. a folyóiratcikk egy konferenciacikkel vitatkozik; adatokkal megadott könyvet ismertet; stb.), érdemes a típust közleményenként a TY paranccsal megadni: ennek beírása gyors és egyértelmű. Ennek jelenlegi lehetőségei: JOUR, CONF, THES, PAT, RPRT, BOOK, CHAP, GEN. A példákban nem megadott publikációknál az import nem tökéletes (szerencsére ezek ritkábbak): a szerző, cím, nyelv, webcím és év megadása mellett a többi mező az N1 mezőbe kerül, és a megjegyzésből kell átmásolni import után a helyére. RIS minta látható itt.

A szerzőket általában vessző választja el, a szerzői nevekben nem lehet vessző. A keresztnevek rövidítésének végén lehet pont. Ha a nevekben vessző van (Smith, John; Kollár, I), akkor pontosvessző választhatja el a szerzőket. A szerzők végét kettőspont jelzi.

A cím végét pont jelzi. A címben ne legyen pont, ha mégis van, akkor a címet tegyük idézőjelek közé. Hasonló a helyzet a konferencia címével (<CT>): ebben vessző ne legyen, és vessző zárja le. A <CL>, <Y2>, <CY> jelzések a konferencia városát, dátumát ill. a kiadás városát jelzik. <L1> a cikk publikus URL-je (hyperlinkeket ne hagyjunk a szövegben, a konvertert megbolondíthatja - a Word file úgy tisztítható ki, hogy mondjuk UTF8-as text file-ba mentjük majd visszaolvassuk). A dátumban egyelőre ne legyen pont vagy vessző. A lezáró jel (pl. </CY>) opcionális. Az In: jelzi a szerkesztett könyv adatainak kezdetét (majd... most még egyelőre nem működik).

A fenti kicsit "túl van specifikálva": a fentieket beírva mind megérti, de a városokat enélkül is felismeri (már van városadatbázis), a pp.-t általában nem kötelező beszúrni, sem a -t. Felismeri a konferenciák nagy részét is.

Az import az Y2 formátumára érzékeny. Ezért felsorolunk néhány lehetőséget (nagyon pontosan kövessük, egy felesleges pont vagy hiányzó szóköz is bajt okozhat, a hónapok neveit is most csak angolul fogadja el! Ráadásul a kötőjel is "kis" kötőjel legyen, nem kis vagy nagy gondolatjel!)

17-18 Sep 2007
2007 Sep 17-18
Sep 17-18 2007
31 Oct 2007 through 2 Nov 2007 (ez a Scopus formátuma...)
31 Oct 2007 - 2 Nov 2007
31/10/2007 - 2/11/2007

A folyóirat neve, különösen ha pontos, jól felismerhető, de a rendszer sokszor rákérdez, jól azonosította-e. Sokat segíthet az ISSN szám megadása, ha tudjuk, mert ez egyértelmű és automatikus folyóirat-hozzárendelést tesz lehetővé. Megadhatjuk pl. így a folyóirat neve után: ", ISSN 1234-567X" vagy így: <SN>1234-567X.

Az alapértelmezett nyelv az angol, ezt nem kell külön megadni, és ha a címben ékezetes (magyar) betűk vannak, akkor a magyart sem. A többi nyelvet igen. A címben szereplő magyar ékezetes karakterek – ha nincs <LA> jellel megjelölt nyelvmegadás – mindenesetre a magyar nyelv beállítását eredményezik, az ä ill. ß karakterek a németet. Az ö és ü a kettő között nem választ, valószínűbben a magyarra utal, mindenesetre nem angol. Vagyis: ha van ä ill. ß, akkor német, ha csak é á van és bizonyos francia karakterek (à è â ô,) vagy kulcsszavak (d' des la á sur sous aux), akkor francia, vagy ha á é í ó ő ú ű, akkor magyar. Tervbe van véve az orosz karakterek detektálása is.

A publikációk egy-egy sorban (bekezdésben) vannak, kivéve a TY  - ... sort, mely külön sor. A publikációkon belül újsor jel nem lehet! A "manual line break" (^l) jelet nem szabad használni, cseréljük le újsor jelre (^p). A nem ismert adatokat & jellel például így lehet megadni: <TI>&</TI> a nem ismert publikációcímet jelzi.

A publex használatakor a publikációk feldolgozásához "A szerző publikációi" opciót kell választani.

Idézők megadása

Az idézőket úgy lehet megadni, hogy a saját publikációkat megadjuk (nem kell a fenti pontossággal, elég, ha többé-kevésbé jó), azután következnek minden egyes publikáció után a hivatkozó közlemények. A beljebb húzott sorok segítenek a file kézi ellenőrzésében, de nem kötelezők. A program állapotát a "Publication:" / "Cited by:" sorok váltják a publikációfeldolgozó / idézőfeldolgozó állapotok között.

Kis János publikációs és idézettségi listája

Publication:
TY  - JOUR
Nagy István, Kis János: Információs rendszerek tervezése. Journal of information, Vol. 6, No. 3, pp. 35-38, 2002.

    Cited by:
    TY  - CONF
    Kis J; Nagy I: "Design of information systems". <CT>Proceedings of WEC'2003, <CL>Montreal, <CC>Canada, <Y2>June 12-14 2003, pp. 5-8.

    Cited by:
    TY  - CHAP
    Smith W: This is a book chapter. pp. 256-289. <ED>Taylor, K: <BT> Book title. <PB>Publisher, <CY>Budapest, 2004. 255 p.<CX>202. oldal:
     Nagy I (2002) solved the problem of information processing.</CX>

Publication:
...

A publikációkat és idézőket a megelőző sor (Publication:/Cited by:) azonosítja. Az idézők típusa általában változó, érdemes egyenként megadni (bár a program kísérletet fog tenni a felismerésre, de tapasztalatunk szerint a találati arány 90-95%-nál nem jobb). A <CX> a szövegkörnyezetet jelzi.

A publex használatakor az idézetek feldolgozásához az "Idéző publikációk" opciót kell választani.

A publikációs adattárba való beolvasáskor az import a saját publikációk azonosítására a következő adatokat fogja használni (bár a bevivő számára kiírja a teljes publikáció-stringet is):

ezek helyes (és felismerhető) megadása tehát fontos (ezért a pp.-t írjuk be a saját közleményekbe).

Például a fenti tartalmú word állomány idézőlistaként RIS formára konvertálva ilyen lesz. Publikációlistaként konvertálva pedig ilyen. Emiatt egy publikáció/idéző lista két lépésben is feldolgozható (publikációlista kiegészítése + idézőbevitel), bár a tapasztalatok szerint a az idézők bevitelekor a szerzők publikációlistája általában teljes (majdnem teljes), ezért ilyenkor csak az idézők bevitelére van szükség. Az is megtehető, hogy a már bevitt publikációk elé a "Publication" helyett a "Publication (duplum)" sor tesszük, ilyenkor publikációnként ismételten biztosan nem kerül be (a duplumfelismerő is kiszűrheti az import során, de az nem 100%-os), viszont az idézők így megadhatók.

Vissza a publikációs főoldalra   Vissza az adatfelviteli oldalra



[1]a BibTeX részletes adatokat tartalmaz, ezért speciálisan kezelendő

[2] A publex program jelenlegi verziójában ingyenesen letölthető BME doktoranduszok, oktatók, kutatók, valamint a BME-OMIKK számára, "garancia nélkül", de működőképesen, felhasználói leírással. A program külön engedély nélkül csak "non-profit" módon használható. A jelenlegi verzió: 2009. 09. 04.
Unzip után a "run" állomány neve "run.bat"-ra cserélendő. A futáshoz Java futtatókörnyezetre van szükség (a leírást lásd bővebben a citex oldalán).
A publex programot (a fenti run.bat) elindítva a program kiír bizonyos adatokat: ezeket kérjük email-ezze el a termékkulcsot kérő levélben az adataival együtt:
    publex helyi felhasználói kulcs (futtatás telepítés után kiírja):    
    név:     
    BME kar:     
    tanszék:     
    beosztás:     
    email-cím:     
    telefonszám: 
és visszakap egy termékkulcsot.