Si të përdorni veglën 'Ngram Viewer' në Google Books

Një Ngram, gjithashtu i quajtur zakonisht N-gram është një analizë statistikore e përmbajtjes së tekstit ose të fjalës për të gjetur n (një numër) të një lloji të artikullit në tekst. Mund të jenë të gjitha llojet e gjërave, si fonemat, prefikset, frazat ose letrat. Megjithëse N-gram është disi i errët jashtë studiuesit, ai përdoret aktualisht në fusha të ndryshme dhe ka shumë implikime për njerëzit që bëjnë programe kompjuteri që kuptojnë dhe përgjigjen me gjuhën e folur natyrore. Kjo, me pak fjalë, do të ishte interesi i Google në ide.

Në rastin e Librave Google Ngram Viewer, teksti që duhet analizuar vjen nga një sasi e madhe e librave që Google ka skanuar nga bibliotekat publike për të populluar motorin e kërkimit të Google Books . Për Google Librat Ngram Viewer, ata i referohen tekstit që do të kërkoni si "korpus". Korrespondenti në Ngram Viewer ndahen nga gjuha, edhe pse ju mund të analizoni veçmas anglishten angleze dhe amerikane ose t'i grumbulloni ato së bashku. Ajo përfundon duke qenë super interesante për të lëvizur nga përdorimi britanik në amerikan të termave dhe të shohin ndryshimet e tabelave.

Si funksionon Ngram

  1. Shko te Librat e Google Ngram Viewer në books.google.com/ngrams.
  2. Artikujt janë të ndjeshëm nga rasti, ndryshe nga kërkimet në internet të Google, prandaj sigurohuni që të kapitalizoni emrat e duhur.
  3. Shtypni çdo frazë ose fraza që dëshironi të analizoni. Sigurohuni që çdo fraza të ndahet me presje. Google sugjeron, "Albert Einstein, Sherlock Holmes, Frankenstein" për të filluar.
  4. Tjetra, shkruani një varg datash. Parazgjedhja është 1800-2000, por ka libra më të fundit (2011 ishte lista më e fundit në dokumentacionin e Google, por kjo mund të ketë ndryshuar.)
  5. Zgjidhni një korpus. Ju mund të kërkoni tekste të gjuhëve të huaja ose në anglisht, dhe përveç zgjedhjeve standarde, mund të vëreni gjëra të tilla si "Anglisht (2009) ose Anglishtja amerikane (2009)" në fund. Këto janë korporata më të vjetra që Google i ka përditësuar, por mund të keni ndonjë arsye për të bërë krahasimet tuaja ndaj grupeve të vjetra të të dhënave. Shumica e përdoruesve mund t'i injorojnë ato dhe të përqëndrohen në korpusin më të fundit.
  6. Vendosni nivelin tuaj zbutës. Zbutja tregon se sa e qetë është grafiku në fund. Përfaqësimi më i saktë do të ishte një nivel zbutës prej 0, por kjo mund të jetë e vështirë për tu lexuar. Parazgjedhja është vendosur në 3. Në shumicën e rasteve, ju nuk keni nevojë ta rregulloni këtë.
  1. Shtypni butonin Kërko shumë të librave . (Ju gjithashtu mund të goditni menjëherë të hyjë në kërkim të menjëhershëm.)

Çfarë është Ngram duke treguar?

Google Librat Ngram Viewer do të nxjerrë një grafik që përfaqëson përdorimin e një fraze të veçantë në libra me kalimin e kohës. Nëse keni futur më shumë se një fjalë ose frazë, do të shihni linjat me kod të ngjyrosur për të kontrastuar termat e kërkimit. Kjo është shumë e ngjashme me Google Trends , vetëm kërkimi mbulon një periudhë më të gjatë kohore.

Këtu është një shembull i jetës reale. Ne ishim kureshtarë për pite uthull kohët e fundit. Ata janë përmendur në Shtëpinë e Vogël të Laura Ingalls Wilder seri Prairie , por kurrë nuk do të kishim dëgjuar për një gjë të tillë. Ne së pari e përdornim kërkimininternet të Google për të mësuar më shumë për pies uthull. Me sa duket, ata janë konsideruar pjesë e kuzhinës amerikane Jugore dhe me të vërtetë janë bërë nga uthull. Ata dëgjojnë përsëri në raste kur jo gjithkush kishte qasje në prodhime të freskëta në të gjitha kohët e vitit. A është e gjithë kjo histori?

Ne kërkuam Google Ngram Viewer, dhe ka disa përmendje të byrekit në të dyja vitet e hershme dhe në fund të vitit 1800, shumë përmendur në vitet 1940 dhe një numër në rritje i përmendjeve në kohët e fundit (ndoshta disa nostalgji me byrek). Epo, ka disa problemi me të dhënat në një nivel zbutës prej 3. Ka një pllajë mbi përmendet në 1800. Sigurisht që nuk kishte një numër të njëjtë të përmendjeve të një byrek të veçantë çdo vit për pesë vjet? Ajo që po ndodh është se për shkak se nuk ka shumë libra të botuar gjatë asaj kohe, dhe për shkak se të dhënat tona janë të rregulluara, ajo shtrembëron pamjen. Ndoshta ka pasur një libër që përmendte byrek me uthull, dhe ai vetëm mori mesatarisht për të shmangur një tufë. Duke vendosur zbutjen në 0, ne mund të shohim se kjo është pikërisht rasti. Spike qendra në 1869, dhe ka një tjetër spike në 1897 dhe 1900.

Askush nuk fliste për uthull pies gjatë pjesës tjetër të kohës? Ata ndoshta flisnin për ato pite. Ka pasur receta që lundrojnë në të gjithë vendin. Ata thjesht nuk shkruan rreth tyre në libra, dhe kjo është një kufizim i këtyre kërkimeve në Ngram.

Kërkim i avancuar i Ngram

Mos harroni se si kemi thënë se Ngrams mund të përbëhet nga të gjitha llojet e kërkimeve të teksteve të ndryshme? Google ju lejon të stërviteni mjaft mirë edhe me Ngram Viewer. Nëse dëshironi të kërkoni për peshkun, folja në vend të peshkut, mund ta bëni duke përdorur etiketat. Në këtë rast, do të kërkoni për "fish_VERB"

Google ofron një listë të plotë të komandave që ju mund të përdorni dhe dokumenteve të tjera të avancuara në faqen e tyre të internetit.