Difference between revisions of "Digitális irodalmi emlékezet Közép-Európában"

From wikibase-docker
(Created page with "A kutatás a közép-kelet-európai régió kortárs önismeretét vizsgálja. Az emögött meghúzódó fő motivációnk, hogy a régió mint kulturális és földrajzi egys...")
 
Line 3: Line 3:
 
Ennek érdekében azt elemezzük, hogy az egyes hagyományokból mely szerzők - írók, költők vagy drámaírók - rendelkeznek Wikipédia-oldalakkal a másik nyelvén. Hipotézisünk szerint, ha egy szerző az egyik irodalmi hagyományból (például Milan Kundera cseh nyelven is publikáló író) szócikként szerepel egy másikhoz kötődő (például a lengyel nyelvű) Wikipedián, akkor mondhatjuk, hogy ez a szerző része egy másik hagyomány irodalmi emlékezetének (Kundera a lengyel irodalmi emlékezetnek), legalábbis elérhetők róla szóló információk az adott hagyományhoz tartozó, leggyakrabban használt enciklopédiában. Így tehát az összes ilyen szerző megszámlálásával kvantifikálható lehet a visegrádi térség irodalmi hagyományainak emlékezete és egymáshoz való viszonya is.  
 
Ennek érdekében azt elemezzük, hogy az egyes hagyományokból mely szerzők - írók, költők vagy drámaírók - rendelkeznek Wikipédia-oldalakkal a másik nyelvén. Hipotézisünk szerint, ha egy szerző az egyik irodalmi hagyományból (például Milan Kundera cseh nyelven is publikáló író) szócikként szerepel egy másikhoz kötődő (például a lengyel nyelvű) Wikipedián, akkor mondhatjuk, hogy ez a szerző része egy másik hagyomány irodalmi emlékezetének (Kundera a lengyel irodalmi emlékezetnek), legalábbis elérhetők róla szóló információk az adott hagyományhoz tartozó, leggyakrabban használt enciklopédiában. Így tehát az összes ilyen szerző megszámlálásával kvantifikálható lehet a visegrádi térség irodalmi hagyományainak emlékezete és egymáshoz való viszonya is.  
  
 +
Módszerünk a Wikidata lekérdezését, az adatok tisztítását, hálózati reprezentációk létrehozását és az eredmények értelmezését foglalja magában.
  
Módszerünk a Wikidata lekérdezését, az adatok tisztítását, hálózati reprezentációk létrehozását és az eredmények értelmezését foglalja magában.
+
Ahhoz, hogy a szépirodalmi szerzők rekordjait megkapjuk, a P106-os „occupation” (foglalkozás) tulajdonságot használtuk, és három értékre szűrtünk: „poet” (költő, Q49757), „writer” (író, Q36180) és „playwright” (színműíró, Q214917). A nemzetiség/állampolgárság kérdésénél úgy döntöttünk, hogy a P1412-es „languages spoken, written or signed” (beszélt nyelvek) tulajdonság elemeit vizsgáljuk, vagyis azokat a szerzőket vettük be a vizsgálandók körébe, akik cseh, magyar, szlovák vagy lengyel nyelven írtak. A Wikidata adatbázis SPARQL lekérdező felületén összesen 36 lekérdezést hajtottunk végre. A lekérdező felület lehetővé teszi, hogy a rekordok bizonyos tulajdonságainak elemeit is láthatóvá tegyük és lementhetőek legyenek. A számunkra fontos tulajdonságok a következőek voltak, amelyeket felhasználtunk az adatok vizualizációja során: „name in native language” (születési/anyanyelvi név, P1559), Wikidata azonosító, „date of birth” (születési idő, P569), „date of death” (halálozási idő, P570), „sex or gender” (nem, P21) és „religion or worldview” (vallás, P140). Az utolsó lekérdezés időpontja: 2024. 09. 18.
 +
 
 +
A metaadatok vizsgálata során egyértelművé vált, hogy kézi ellenőrzésre is szükség van. A munkának ebben a fázisában az adott személy által írt művek műfaját vettük irányadónak. Az időbeli határvonalat 1800-nál húztuk meg, mivel sok műfaj irodalomtörténeti megítélésének változása, illetve több műfaj kialakulása ehhez az időponthoz közelíthető. Ezt az elvet érvényesítettük az egyházi/vallási irodalom, az emlékiratok, az önéletrajzok és utazási irodalom műfajainak esetében. A fantasy, a tudományos fantasztikus irodalom, valamint a gyerekirodalom alkotásait figyelembe vettük egy-egy életmű vizsgálatakor, az esszéket, műfordításokat és dalszövegeket viszont nem, tehát akik kizárólag az utóbbi műfajokban alkottak, azok nem kerültek be a végleges szerzőlistánkba. Semmilyen időhatárt nem adtunk meg a lekérdezéseknél.

Revision as of 10:42, 24 January 2025

A kutatás a közép-kelet-európai régió kortárs önismeretét vizsgálja. Az emögött meghúzódó fő motivációnk, hogy a régió mint kulturális és földrajzi egység képzete az elmúlt évtizedekben veszített magyarázó erejéből, miközben az egyes nemzeti hagyományok egyre inkább befelé fordulnak és/vagy a nyugati, globális trendekhez igazodnak. A projekt első lépéseként, a visegrádi országokra (Csehország, Lengyelország, Magyarország és Szlovákia) összpontosítunk, és azt vizsgáljuk, e négy hagyomány milyen mértékben ismeri egymás irodalmi kultúráját.

Ennek érdekében azt elemezzük, hogy az egyes hagyományokból mely szerzők - írók, költők vagy drámaírók - rendelkeznek Wikipédia-oldalakkal a másik nyelvén. Hipotézisünk szerint, ha egy szerző az egyik irodalmi hagyományból (például Milan Kundera cseh nyelven is publikáló író) szócikként szerepel egy másikhoz kötődő (például a lengyel nyelvű) Wikipedián, akkor mondhatjuk, hogy ez a szerző része egy másik hagyomány irodalmi emlékezetének (Kundera a lengyel irodalmi emlékezetnek), legalábbis elérhetők róla szóló információk az adott hagyományhoz tartozó, leggyakrabban használt enciklopédiában. Így tehát az összes ilyen szerző megszámlálásával kvantifikálható lehet a visegrádi térség irodalmi hagyományainak emlékezete és egymáshoz való viszonya is.

Módszerünk a Wikidata lekérdezését, az adatok tisztítását, hálózati reprezentációk létrehozását és az eredmények értelmezését foglalja magában.

Ahhoz, hogy a szépirodalmi szerzők rekordjait megkapjuk, a P106-os „occupation” (foglalkozás) tulajdonságot használtuk, és három értékre szűrtünk: „poet” (költő, Q49757), „writer” (író, Q36180) és „playwright” (színműíró, Q214917). A nemzetiség/állampolgárság kérdésénél úgy döntöttünk, hogy a P1412-es „languages spoken, written or signed” (beszélt nyelvek) tulajdonság elemeit vizsgáljuk, vagyis azokat a szerzőket vettük be a vizsgálandók körébe, akik cseh, magyar, szlovák vagy lengyel nyelven írtak. A Wikidata adatbázis SPARQL lekérdező felületén összesen 36 lekérdezést hajtottunk végre. A lekérdező felület lehetővé teszi, hogy a rekordok bizonyos tulajdonságainak elemeit is láthatóvá tegyük és lementhetőek legyenek. A számunkra fontos tulajdonságok a következőek voltak, amelyeket felhasználtunk az adatok vizualizációja során: „name in native language” (születési/anyanyelvi név, P1559), Wikidata azonosító, „date of birth” (születési idő, P569), „date of death” (halálozási idő, P570), „sex or gender” (nem, P21) és „religion or worldview” (vallás, P140). Az utolsó lekérdezés időpontja: 2024. 09. 18.

A metaadatok vizsgálata során egyértelművé vált, hogy kézi ellenőrzésre is szükség van. A munkának ebben a fázisában az adott személy által írt művek műfaját vettük irányadónak. Az időbeli határvonalat 1800-nál húztuk meg, mivel sok műfaj irodalomtörténeti megítélésének változása, illetve több műfaj kialakulása ehhez az időponthoz közelíthető. Ezt az elvet érvényesítettük az egyházi/vallási irodalom, az emlékiratok, az önéletrajzok és utazási irodalom műfajainak esetében. A fantasy, a tudományos fantasztikus irodalom, valamint a gyerekirodalom alkotásait figyelembe vettük egy-egy életmű vizsgálatakor, az esszéket, műfordításokat és dalszövegeket viszont nem, tehát akik kizárólag az utóbbi műfajokban alkottak, azok nem kerültek be a végleges szerzőlistánkba. Semmilyen időhatárt nem adtunk meg a lekérdezéseknél.