Un Ngram, de asemenea, numit în mod obișnuit un N-gram, este o analiză statistică a conținutului de text sau de vorbire pe care îl găsim n (un număr) de un fel de element din text.
Elementul de căutare ar putea fi tot felul de lucruri, cum ar fi foneme, prefixe, fraze sau litere. Deși N-gramul este oarecum obscur în afara comunității de cercetare, este folosit într-o varietate de domenii și are multe implicații pentru dezvoltatorii care codifică programe de calculator care înțeleg și răspund la limbajul natural vorbit.
În cazul programului Google Books Ngram Viewer, textul care urmează să fie analizat provine din cantitatea vastă de cărți pe care Google le-a scanat din bibliotecile publice pentru a popula motorul de căutare Google Cărți. Pentru Ngram Viewer Google Books, se referă la textul pe care îl veți căuta ca corp . Ngram Viewer se agregă în funcție de limbă, deși puteți analiza separat engleza britanică și cea americană sau le puteți strânge împreună.
Cum funcționează Ngram
-
Accesați Ngram Viewer Google Books la books.google.com/ngrams.
-
Introduceți orice expresie sau fraze pe care doriți să le analizați. Separați fiecare frază cu o virgulă. Google sugerează, "Albert Einstein, Sherlock Holmes, Frankenstein" pentru a vă începe. Elementele sunt sensibile la litere mari și mici, spre deosebire de căutările web Google.
-
Tastați un interval de date. Valoarea prestabilită este de la 1800 la 2000.
-
Alegeți un corpus. Puteți căuta texte în limbile străine sau engleză și, în plus față de alegerile standard, puteți observa lucruri precum "Engleză (2009) sau engleză americană (2009)" în partea de jos. Acestea sunt corporații mai vechi pe care Google le-a actualizat de atunci, dar este posibil să aveți un motiv pentru a face comparațiile împotriva seturilor de date vechi. Majoritatea utilizatorilor le pot ignora și se pot concentra pe cele mai recente corporații.
-
Stabiliți nivelul de netezire. Netezimea se referă la cât de netedă este graficul la sfârșit. Cea mai precisă reprezentare ar fi un nivel de netezire de 0, dar această setare poate fi dificil de citit. Valoarea implicită este setată la 3. În majoritatea cazurilor, nu este necesar să o ajustați.
-
apasă pe Căutați o mulțime de cărți buton.
Google vă permite să faceți o treabă destul de mică cu Ngram Viewer. Dacă doriți să căutați pește verbul în loc de pește substantiv, puteți face acest lucru prin utilizarea de etichete. În acest caz, ați căuta "fish_VERB"
Google oferă o listă completă de comenzi pe care le puteți utiliza și alte documentații avansate pe site-ul lor web.
Ce este Ngram afișat?
Google Books Ngram Viewer va scoate un grafic care reprezintă utilizarea unei anumite fraze în cărți în timp. Dacă ați introdus mai mult de un cuvânt sau o expresie, veți vedea linii colorate pentru a contrasta diferiți termeni de căutare. Acest lucru este destul de similar cu Google Trends, numai căutarea se referă la o perioadă mai lungă de timp.
Studiu de caz
Luați în considerare studiul de caz al plăcilor de oțet. Sunt menționați în versiunea lui Laura Ingalls Wilder Casa mică pe Prairie serie. Explorarea cu ajutorul căutării pe Web a Google pentru a afla mai multe despre plăcile de oțet arată că acestea sunt considerate parte din bucătăria sudică americană și sunt într-adevăr făcute din oțet. Aceștia ascultă în momentele în care nu toată lumea avea acces la produse proaspete în orice moment al anului. Dar asta este întreaga poveste?
Căutați Google Ngram Viewer pentru placinta de otet și veți întâlni câteva mențiuni despre plăcintă atât la începutul, cât și la sfârșitul anilor 1800, o mulțime de mențiuni în anii 1940 și un număr tot mai mare de mențiuni din ultima vreme. Cu toate acestea, cu un nivel de netezire de 3 veți vedea un platou peste mențiunile din anii 1800. Deoarece nu există o mulțime de cărți publicate în acel moment și deoarece datele noastre sunt setate pentru a netezi, distorsionează imaginea. Probabil a existat o carte care menționa placinta de oțet, și tocmai a obținut o medie pentru a evita un vârf. Dacă setăm netezirea la 0, putem vedea că acesta este exact cazul. Centurile de vârf din 1869, iar în 1897 și 1900 există un alt vârf.
Este puțin probabil ca nimeni să nu vorbească despre plăcări de oțet în restul timpului: au existat probabil rețete plutitoare peste tot, dar oamenii tocmai nu scrie despre ei în cărți, și aceasta este o limitare importantă a acestor căutări Ngram.