Ankstesniame įraše (
http://apieniekus.blogspot.lt/2016/12/kaip-ai-sapnavo-lietuviskus-vardus.html) neuroninį tinklą mokinau raidžių, o anas kiek prakutęs pradėjo ir vardus sapnuoti. Tačiau dirbtinį intelektą kalbos galima mokyti ir stambesniais vienetais, t.y. vietoj raidžių galima iškart mokyti žodžių ir santykių tarp jų. Vienas įdomesnių metodų taikomų verčiant žodžius į mašinoms suprantamą formatą yra
word2vec. Jis paremtas paprasta mintimi, kad kiekvienas žodis sutransliuojamas į daugiamatį (pvz. 100 matavimų) skaičių vektorių, taip, kad žodžiai vartojami panašiame kontekste sugultų greta šioje erdvėje. Plačiau pasiskaityti galima:
https://en.wikipedia.org/wiki/Word2vec,
https://deeplearning4j.org/word2vec.
Šį transliavimą paprastai atlieka dviejų sluoksnių neuroninis tinklas, kuris apmokomas ant pakankamai didelės sakinių duomenų bazės. Įdomu, kad mokindamasis tik iš duotų sakinių, tinklas pradeda atskirti ne tik kokie žodžiai dažnai eina greta, bet ir jų sinonimus. Pavyzdžiui apmokius tinklą lietuviškos Wikipedijos turiniu ir uždavus žodį
moteris, šie žodžiai randami kaip artimiausi pagal kontekstą:
mergaitė, mergina, merginos, moterį, moters. Taip pastebėta, kad tinklas gali spręsti ir sudėtingesnes logines užduotis, kaip kad "Ryga yra Latvijai kaip X yra Estijai", algebriškai užrašius "
Ryga - Latvija + Estija" gaunamas atsakymas, jog labiausiai tikėtinas atsakymas yra Talinas. Su šia aritmetika galite pasižaisti startuolio
TokenMill puslapyje:
http://word2vec.tokenmill.lt.
Tiesa, reikia pastebėti, kad šiam kalbos analizės metodui lietuvių kalba nėra itin dėkinga, nes tas pats žodis gali turėti daug formų (linksniai, giminės ir pan.), ir kiekviena tokia forma traktuojama kaip atskiras žodis. Esant pakankamai didelei apmokymo bazei jie atsidurs arti vienas kito, kaip sinonimai, ką ir buvo galima pastebėti ankstesniame pavyzdyje, kada "
moterį", "
moters" atsidūrė arti "
moteris", tačiau mokantis iš nelabai didelės bazės skirtingi to pačio žodžio linksniai gali atsidurti gan skirtinguose kontekstuose, ką netrukus ir pamatysime.
Linksmybės ir mokslo labui apmokiau tinklus ant trijų skirtingų sakinių bazių: Delfi antraščių (~10000 vienetų), Delfi straipsnių (~2000 vienetų, apie 12 MB teksto) ir lietuviškos Wikipedijos (apie 250 MB teksto). Tada paprašiau, kad tinklai paatvirautų keliomis svarbiomis gyvenimiškomis temomis. Ir štai kas gavos..
Apie transportą
Žodis
|
Delfi antr.
|
Delfi str.
|
Wiki
|
autobusas
|
draugo, prispaudė, apvirtęs, pėdas, girtas, vairuotojas, tvoras, klaipėdietis, išvartė, vežęs
|
palikęs, škoda, mazda, sukdama, renault, važiavęs, pakelėje, vairuojamo, tarpmiestinio, ukrainietė
|
autobusai, autobusų, maršrutinis, troleibusai, taksi, traukiniai, kursuoja, troleibusų, traukinys, maršrutais
|
automobilis
|
eismą, užsidegęs, griovyje, sutrikdė, reguliuoti, spūstyje, įtemptoje, iškviesti, staigi, apvirsti
|
partrenkė, vw, touareg, važiavęs, kliudė, vairuotojas, važiavo, caddy, sudaužytas, golf
|
kabrioletas, fiat, visureigis, chrysler, kupė, veyron, nebegaminamo, granturismo, pikapo, kėbulu
|
dviratis
|
evanso, elektrinis, vedėjo, aukščiausios, pavaros, pavogtas, parsivežkime, jarutis, idée, bulgariškais
|
kilusi, pavogtas, didžiulis, pabandė, jurijus, legendinės, plaukikė, pjūvio, atsiveždavau, vagystę
|
trekas, dviračių, dviračiai, dviračius, pienvežis, dviračiu, sportinis, demonstruojamas, rankinis, bmx
|
bmw
|
rėžėsi, motiną, vairuojamas, pakraštyje, suluošintų, ašaros, įžūlaus, persekioja, medį, pažadinusio
|
apdaužytas, vairuojamo, partrenkė, kliudė, qashqai, nesustojo, važiavęs, ford, caddy, passat
|
renault, audi, toyota, maserati, ferrari, gt, peugeot, marussia, lancia, porsche
|
vairuotojas
|
girtas, bėgo, automobilio, stotelėje, vežęs, pėdas, svaidėsi, panevėžys, autobusas, sužalojęs
|
automobilio, važiuodamas, automobilį, automobilis, keleivis, vairuotojui, pėsčiojo, važiavęs, nekvietė, automobilyje
|
autobuso, mašinistas, sunkvežimį, vairuotojo, sunkvežimiu, vairuotojai, denį, išvažiuoja, vairuojamą, važiuoja
|
vairuotoja
|
sužalo, girta, motociklininkui, avaringiausias, antradienis, sistemoje, kaltę, mirtinai, baisi, darbuojasi
|
keleivė, važiavusi, qashqai, golf, sužalota, sužeistas, toyota, išvežtas, sužalotas, važiavęs
|
praktikavosi, trenerę, režisierę, vienmetę, naomė, metė, pabaigęs, baigusi, aktorystės, nisonas
|
Pagal Delfi antraštes autobusai ir automobiliai daugiau nieko nedaro tik virsta pakelėse ir žaloja žmones, Delfi straipsniuose kontekstas ne ką geresnis, tuo tarpu santūrioji Wikipedija vardina sinonimus bei pagal paskirtį glaudžiai susijusias transporto priemones:
taksi,
traukiniai,
troleibusai. Dviratis Delfi antr. trumpam nušvinta pozityviom spalvom, bet greit būna pavogtas. Panašiai ir straipsniuose. Wiki gi žavisi dviračių sportu. BMW Delfi antraštėse bei straipsniuose rėžiasi į medžius ir žaloja visus, bet čia nieko asmeniško, nes įvedus Ford ar VW gaunamas kontekstas labai panašus. Wiki tuo metu svajoja apie Ferrari, Porsche, Lancia.. Na o jei vairuotojas/-a patenka į Delfi antraštes, tai garantuotai buvo girtas/-a ir galimai bėgo, ar kažką sužalojo. Wiki gi mano, kad tai gan normali profesija.
Apie ekonomiką
Žodis
|
Delfi antr.
|
Delfi str.
|
Wiki
|
eurų
|
mln, už, tūkst, startas, projektams, mlrd, duotas, monetą, esm, kroviniai
|
cavillas, mln, henry, tūkst, willas, affleckas, dolerių, reklamai, skoloje, investavusi
|
itų, mlrd, pajamos, usd, eur, vertės, asignavimai, svarų, sterlingų, mln
|
litų
|
grupuotė, nuteista, pasisavinusi, teistumą, užsidirbo, dešimtis, bumerangu, plagijavimu, pasala, tūkstančių
|
balčiūnaitė, atmestas, kasmėnesines, viršijančias, priteisti, priteisė, nesąžiningą, poelgiu, įduotų, primadonų
|
eurų, mlrd, pajamos, asignavimai, rublių, usd, kainavo, pelnas, mln, investuota
|
pensijos
|
kontrabandininku, uniformuotu, kompensuotos, nebegaus, pasienyje, choreografo, fiksuojamas, išvados, išimtis, mokykloms
|
darbingumo, vertintoją, pajamos, dividendų, mokėjimus, skaidrumas, fiziniai, paketai, pridėtinės, mokamos
|
bedarbio, pašalpos, pašalpų, cenzą, tarnautoju, inspekcijoje, algos, pašalpa, užmokesčio, notaru
|
pensininkų
|
bendrijos, nevyriausybinės, organizacijos, sukauptu, darys, turtu, nepainiokite, asociacijos, mažos, liūtas
|
pažeidžiantis, monopolizuoti, hye, palankumą, lozoraitį, patogiuose, respublikonas, besivadinusi, sergejumi, aamžiaus
|
veikliausių, neįgalių, ljūrs, lpkts, sveikuolių, liberaldemokratai, darbiečių, bočiai, merų, medelynų
|
ateitis
|
skambina, varpais, rekonstrukcijos, plauko, ūkiui, kitokiam, galą, sodo, piešiama, startuoliams
|
prisipažinsiu, tiesos, neturėčiau, tobula, gaila, optimistė, neslėpsiu, nustembi, mikroklimatas, taikstytis
|
rytojus, tėviškės, viltis, romuva, sargas, kuntaplis, laikraščiuose, aidas, leidiniuose, savaitraštyje
|
praeitis
|
įrankius, laužtuvai, vagių, savininkus, viršininko, šiuolaikinių, tapusiai, prancūziškas, meiluže, jautienos
|
kolonializmas, kvepalus, šypsotis, karminiai, smagiai, neprekiauti, dievui, asortimente, antraštės, greitesnį
|
metraštis, dabartis, sudarytoja, praeities, prisiminimai, apybraiža, kasdienybė, leidykla, dienovidis, bibliografija
|
alga
|
padidės, posėdžių, venckienei, nelankiusiai, nepriklauso, minimali, gynėjai, žvalgybininkų, infografikas, darmštate
|
minimali, mėnesinė, pakeliamas, atlyginimas, trasa, negatyvias, suplanuota, atlygis, stažo, sukilimais
|
išmokėta, algos, atlyginimas, mokama, reichsmarkių, užmokestis, išmokėdavo, išmokama, sumokėta, sumokėjimą
|
atlyginimas
|
skirtis, nesulaikė, neištvėręs, neturėtų, neišvažiuotų, emigrantus, seserys, mokytojo, hemorojus, ministrė
|
stažo, mažinamas, vienetą, minimali, parulskienė, kompensuoti, skaičiuojamas, išmoka, sumokėjusioje, pasensta
|
atlyginimą, atlyginimo, algos, mokestis, išmoką, išmokama, skolą, mokesčio, mokama, sumokėta
|
emigrantas
|
grįžęs, kažkoks, neteisi, kosmosas, atsisakęs, patikėti, nesišypsoti, sunku, haskiai, svajonių
|
išvažiuot, pasižiūrėsiu, ruošiuosi, galėjau, baisu, neatsiklausė, padlaižiavimas, nesakyčiau, sudainuoti, optimistas
|
jurčičius, kosovelis, šklovskis, stabsas, senelis, abrahamas, apdaikas, masonas, impresionistas, komenskis
|
emigrantų
|
turtais, neatsidžiaugia, rojų, vicemero, saldainių, nuotraukas, palikti, prabanga, slepiama, perlaidoms
|
baublius, švelniausiai, nebeatvažiuoja, norinčių, išvykusių, kavinėse, įprasta, užgniaužto, komediją, absurdą
|
imigrantų, išeivių, inteligentų, išeivija, pabėgelių, deportuota, emigrantus, emigrantai, pasitraukusių, libaniečių
|
Jei Delfi rašo apie eurus, tai dažniausiai nieko blogo, bet jei apie litus, tuomet jau garantuotai teistumas. Wiki abi valiutas pripažįsta kaip normalias valiutas pajamoms ir investicijoms. Delfi antraštės sako, kad pensijas kompensuos uniformuotiems kontrabandininkams, įdomu.. Įdomu ką apie ateitį mano tie trys šaltiniai. Delfi antraštės piešia galą ūkiui ir startuoliams, taip jiems ir reikia! :) Delfi straipsniai daug pozityvesni ir mano, kad ateitis bus tobula, o gal čia ironija? Wiki, mano, kad ateitis bus paskelbta laikraščiuose, kas visai logiška. Tuo tarpu praeitis Delfi antraštėse dažnai susijus su vagystėms ir meilužėm, o kaip kitaip? Straipsniuose ji kvepia kolonializmu, nesiginčysiu. O Wiki sako, kad praeitis nusėda metraščiuose. Delfi antr. sako, kad alga didės, tačiau Venckienei nepriklauso. Straipsniuose detalizuojama, kad alga didės, bet greičiausiai minimali. Atlyginimas antraštėse dažniausiai neišveria ir emigruoja.. Emigrantas antraštėse grįžęs, kažkoks, kosmosas, na ir dažnai neatsidžiaugia radęs rojų bei turtus. Straipsniuose viskas kiek mažiau medum tepta, yra ir baimės, ir komedijos ir absurdo. Wikipedija vis dar gyvena praeitame šimtmetyje, kai emigrantai buvo seneliai, inteligentija ir romantiškai vadinosi išeivija.
Apie maistą ir gėrimus
Žodis
|
Delfi antr.
|
Delfi str.
|
Wiki
|
vanduo
|
paplūdimius, įkritai, skandina, pasiglemš, paskęsti, nekelk, tikimybė, jūra, kėsinasi, baimė
|
nuotekos, ląstelės, oda, atitekantis, lašelių, nuograndos, guma, nepatektų, sausa, paviršinis
|
drumzlinas, vandeniui, skaidrus, užterštas, nuotėkomis, buitinėms, trykštančių, išgaravus, paplūsta, mineralizuotas
|
vandenį
|
nekelk, ledinį, įkritai, emigrantus, įkritęs, skrandžiu, paskęsti, šuolių, šokinėjant, atlyginimas
|
daržoves, virintą, kremo, įsišaknyti, dribsnius, padažu, įspausti, išgarina, žirkles, termiškai
|
indą, orą, dulkes, pumpuojamas, gruntą, vanduo, tekėdavo, vandeniui, vandeniu, vandens
|
pienas
|
galiojimo, demonizuojamas, ilgo, tikrus, darote, galvojame, vėliau, sovieticus, krašte, pirmi
|
gouda, baltled, foods, germanto, indelyje, tcm, karamelizuotais, opto, vaniliniai, plombyras
|
sūris, varškės, sviestas, miltai, sūrio, arbata, sirupas, varškė, sojų, išspaudos
|
pieną
|
nutraukiančios, reklamą, propaguojanti, krūtimi, sukritikavo, wilde, arklį, liemenėlės, sidabras, gamtą
|
riešu, gaktą, duobėtais, daržai, vonele, pieštukų, šimteriopai, bambos, sauskelnių, žvali
|
sviestą, spiritą, vyną, pienas, varškės, ghi, sūryme, sėmenų, mėsą, virti
|
vynas
|
[]
|
ragauta, potencialu, gaidomis, vynuogės, taninai, poskonis, gelmę, sodrus, tvirtas, prieskoniai
|
gėrimas, obuolių, sūrio, sirupas, sūris, vynuogių, pienas, medus, jogurtas, likerio
|
šampaną
|
[]
|
putojantį, įsimenančios, mokėtina, nepiešime, užtaisą, eičiau, nesaugu, click, nuobodus, plentinis
|
įpakuotas, traškūs, užkemšami, pilstant, užraugti, ragauti, stiklinėse, patiekalui, kosmetinių, saugesnė
|
šlapimas
|
šparagais, atsiduoda, moterišką, eilutę, stiklai, turėtumei, ligoniui, meškučiais, šerno, akmens
|
[]
|
cistos, edema, pūslei, nekrozė, šigeliozės, apnašos, spindį, nukraujavimo, skaidulas, patinimas
|
geria
|
prieinamą, svaiginimosi, legaliai, valiklį, jaunimas, atranda, pavojingą, būdų, mirtinai, serijiniai
|
narkotinė, vartojama, valerijonus, racionalus, kamščiai, vartojantis, apdujęs, tirpiklis, psichologinis, kontaktus
|
valgo, valgyti, mėsą, gerti, puodelyje, saldumynus, skanesnis, košes, arbatą, išvirti
|
valgo
|
pipirą, nepaaiškinamas, protu, sveiku, vaiduoklį, pavojingą, mirtinai, skirstymo, slovakija, pamokyti
|
atsiveda, negalėčiau, ponai, užduoda, laikęs, tvarkosi, myli, pailsiu, visad, neklausinėja
|
mėsą, valgyti, geria, riešutus, keptus, duoną, daržoves, košes, pusryčiams, melionus
|
koldūnai
|
triušiena, višta, plokštelė, keksiukai, kompaktinė, batatų, cinamonu, nominuota, pažinčiai, naminiai
|
bulviniai, genetika, koridoriuje, užimdamos, šypsotis, metabolizmą, vartodami, užgniaužto, tingėjimas, šienaudavo
|
virtiniai, lakštiniai, dešrelės, baklava, giozleme, neraugintos, faršas, pyragėliai, įdaromi, fufu
|
nuodai
|
lėkštėje, lašišą, gudrybė, nemaloni, nudažo, įdomiausių, hormoną, oranžine, žuvį, tarpukariu
|
[]
|
jautriems, glikozidai, žarnyne, malšina, virinant, toksiški, sukėlėjai, treonino, birios, išmatose
|
veganai
|
[]
|
vegetarai, botulizmą, brangesnį, negebėjimas, dalykiški, kavinę, ląstelienos, užgimstantys, nuvertinti, nebeužsimena
|
gyvūninius, nepavojingi, vegetarizmą, kraštutines, žalojami, nemažėja, alergiški, dietą, beverčiai, nevadinami
|
vegetarai
|
[]
|
veganai, ląstelienos, uždirbate, dalykiški, negebėjimas, prisikaupia, užgimstantys, brangesnį, tendencingą, ištapetuoti
|
nepavojingi, pasveiksta, neišnešioti, sukėlėjams, užsikrėtę, santykiaujant, sirgti, nutukę, insultu, glamones
|
[] - reiškia, kad žodis tokia forma atitinkame šaltinyje nebuvo panaudotas. Bendrai paėmus, su maistu ir gėrimais sekėsi kiek prasčiau, nes jie matyt rečiau patenka į Delfi akiratį. Pastebėtina, kad antraštėse vanduo tinkamas tik arba įkristi ir skęsti. Straipsniuose, jau pastebima, kad galima jame maistą ruošti, na ir dar nuotekų sudedamoji dalis. Wiki jis taip pat linkęs tekėti, o ne būti geriamas. Įdomu, kad pienas vardininko linksnyje yra normalus produktas su galiojimo laiku ir pan. O galininko linksnyje jau dominuoja maitinimo krūtimi kontekste. Wiki tokių keistenybių mažiau. Kalbant apie vyną, Delfi edukuojasi ir kalba apie taninus, gaidas ir tvirtus.. Tuo tarpu šlapimas šparagais atsiduoda, ir dar galima ligoniui.. no comments. Jei Delfyje kas geria, tai galimai legalų valiklį ar valerijonus. Wiki geria arbatą, jūsų teisė rinktis. O jei kas Delfyje valgo, tai pipirą ir dar myli ir neklausinėja. Matyt pagal tą patarlę, kad viskas per skrandį. Jei koldūnai, tai naminiai iš bulvių ir su triušiena. Delfi mano, kad veganai ir vegetarai yra nuvertinti, o Wiki mano, kad jie nepavojingi. Pritariu Wiki.
Apie pramogas
Žodis
|
Delfi antr.
|
Delfi str.
|
Wiki
|
knyga
|
mesti, gurmanų, lieknųjų, supratau, scena, virusu, likau, patenkints, kalbina, norintiems
|
visoms, parengta, beletrizuota, besidomintiems, herojės, nepasibaigusi, biblijoje, matu, istorija, pagražinti
|
šerelytės, krakatukų, iliustruota, romanas, knygos, esė, satyrinė, apsakymas, knygelė, autobiografinė
|
sužalojo
|
peiliu, brolį, senuosiuose, trakuose, nepilnametis, neblaivus, sužalo, avaringiausias, sunkiai, sumušė
|
vairuodama, partrenkė, vairuojamą, važiavęs, gimęs, mirtinai, kliudė, mitsubishi, gim, caddy
|
trenkęs, užkasė, nesunaikintų, užpuolikams, palaidoja, nukauti, nužudydamas, nūmenoro, pilafas, rykštėmis
|
glumina
|
spenelius, lipdukais, kalėdiniais, rourke, krūtų, katlerio, karštukė, pridengė, veikla, trukus
|
ištaisys, pasimiršo, išvažiavusius, teatrališkumas, užrezervuoti, briedei, nevažiuosiu, įlūžtant, įkyrėjo, nelaukiamas
|
anonimu, nesupras, skarletę, pornografiją, įdomias, egzaminuotojas, pasimetę, dirbame, rasizmui, gėjumi
|
krūtų
|
apnuogintų, paskyroje, spenelius, kalėdiniais, sėdmenų, lipdukais, glumina, naujoje, karštukė, pridengė
|
prigesintų, peržengoti, dekorą, silpnumo, negebėjimo, susikaupti, darbadieniais, apjuosiantys, pulsą, katilai
|
androgenų, orgazmo, makšties, detumescencija, estrogenų, erekcijos, atsiranda, kaklelio, nepakankamumui, pabrinkimas
|
liemenėlės
|
rojuje, straipsnyje, astos, valentaitės, nereikalingos, reklamą, nutraukiančios, pieną, atostogos, krūtimi
|
netikslinga, eksperimentinis, linksmiau, komitetot, bejėgis, džiūgavimas, šlovinti, kabotų, sužinotumėte, privačiai
|
tatuiruotės, aukštakulniai, plaukams, storesnio, nosys, siuvamas, palaidinės, įpakuoti, narvasadata, deformuotos
|
nuvertė
|
valdžią, blondinėms, laursas, pamokyti, tautiečiai, vyresnius, skelbiame, dominti, lengvesnis, papuola
|
remtą, janukovyčių, protestuojantys, viktorą, rūgštiems, potvarkiai, įsakymai, dirvožemiams, atsišaukimai, afišos
|
pasiskelbė, sadi, fesą, paėmė, odoakras, valdžią, mingdi, sukilo, tašmino, marakešą
|
girtas
|
vairuotojas, draugo, pėdas, apvirtęs, rėžėsi, autobusas, matėte, kraupioje, pražudė, prispaudė
|
vairavęs, sėdo, neblaivus, sužalotas, įpūtė, blaivus, partrenkė, nereguliuojama, toyota, važiavusi
|
prisiminė, atstumtas, džeikas, mifune, antoneli, pažįstamo, lepino, merfis, vagis, aizija
|
girta
|
vairuotoja, sužalo, motociklininkui, avaringiausias, kaltę, nesustojo, keliuose, partrenkęs, antradienis, baisi
|
[]
|
[]
|
vietelės
|
depiliuoti, neverta, intymios, specialistės, neišduoda, neturėtumėte, šešios, kontroliuojamas, storėja, taškysis
|
šiltesnės, ramūnui, užmegsi, šventą, sausainį, išmokė, svetimas, patikima, laiptais, susikūrė
|
[]
|
asmenukė
|
nuogybes, štangomis, pridengė, steep, ekstremalaus, žaidimo, story, apgavyste, pramogos, rogue
|
fragmentu, šukuosena, suoliuko, nevaikštau, keptuvės, feisbukuomenė, nueidavau, eco, rūsčiajam, pritvirtintu
|
fichu, voku, pirštine, aivenas, akiniais, įtvaras, pavadėlio, suknelėmis, paltu, atveriamas
|
drabužius
|
nesudėtinga, kuzmickaitė, priežiūra, vulgaru, gelbėtoja, seksualu, nusimetė, kuriant, buvusi, vilnonius
|
nesportuojate, liemenę, vilkitės, citrina, akcentus, subtilesnių, užmaskuos, derėtų, probleminių, niuansas
|
rūbus, batus, aksesuarus, papuošalus, daiktus, sukneles, dėvėti, maistą, skrybėles, sijonus
|
nustebino
|
pastebėti, maloniai, geriančią, skrandžiu, tuščiu, linijų, kūnu, jaunesnės, įsivėlė, mėnesio
|
prisiminimais, karbauskį, suprastumėte, nudrengtą, pirmokas, neįsivaizdavau, tėvu, improvizacijos, dailininko, mergaitės
|
kubicą, hamiltonui, aplenkus, nokautavo, schumacherio, pasiekimą, favoritai, nenusileido, mossas, šešioliktą
|
Knyga Delfyje skirta liekniems gurmanams. Jei kas ką sužalojo, tai pagal Delfį, arba brolį arba avarijoje. Wiki gi linksta link klasikinio detektyvo. Delfio antraštėse spenelius glumina kalėdiniai lipdukai ir Katleris (good for him). Gi teta Wiki gluminasi pornografija, rasizmu ir gėjais. Delfi antr. krūtys visad apnuogintos, o straipsniuose trukdo susikaupti (tikėtina). Wiki imasi fiziologijos ir erekcijos. Tuo tarpu Valentaitės liemenėlės pateko į rojų Delfi antraštėse, o straipsniuose pripažįstamos netikslingomis. Wiki linksta į pin-up'ą. Laursas gi nuvertė valdžią (bent jau antraštėse), straipsniuose gi nuverstas Janukovičius. Na ir kaip jau minėta anksčiau, jei girtas/-a pateko į Delfi, tai reiškia, kad vairavo ir gal kažką partrenkė. Delfi antraštės nepataria depiliuoti intymių vietelių, o straipsniuose jau šiltos vietelės susijusios su Ramūnu.. Asmenukėse, anot Delfi, turi būti nuogybės pridengtos štangomis, galima ir keptuvėmis. Antraštėse drabužius nusimetama, paprastai vilnonius, o straipsniuose priešingai drabužiai užmaskuoja kažką problemines. Delfi antraštes lengva nustebinti tuščiu skrandžiu, straipsnius stebina prisiminimai apie Karbauskį. Wiki stebisi Formule 1.
Apibendrinant galima pasakyti, kad Wiki, tai šiek tiek senstelėjusi bibliotekininkė, kuri vis dar gyvena praeitame šimtmetyje, kartais paskaito detektyvus, o kilus erotinei nuotaikai atsiverčia medicinos enciklopediją. Delfi straipsnius ko gero personifikuoja jaunas vadybininkas, kuris kartais išgeria vyno, tada taninai jam muša per galvą, o pastaroji gimdo antraštes, na ir kartais ką nors partrenkia. Iš kitos pusės negalima pasakyti, kad antraštės būtų stipriai pabėgusios nuo tekstų turinio, tad gal per dažnai jas kaltinam. Rimtesnių problemų yra transporto ir pramogų (kriminalų) srityse, kur viskas sukoncentruota į kelis skurdžius naratyvus. Delfi pasirinktas tik dėl to, kad gan populiarus, tad nereiktų priimti, kad tai vieno portalo bėdos ar džiaugsmai, ko gero panašius rezultatus būtų galima gauti ir naudojant kitų portalų medžiagą.
P.S. jei nenusibodo skaityti, čia šiek tiek daugiau žodžių palyginimų:
https://docs.google.com/document/d/1pPMFj3riuUcLhPwYWhbTEGJbAmPtiJBjyRr5gU3DCgM/edit?usp=sharing
P.P.S. kodą word2vec generavimui ėmiau iš
https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/nlp/word2vec/Word2VecRawTextExample.java.