כיצד להשתמש בכלי Ngram Viewer ב-Google ספרים

תוכן עניינים:

כיצד להשתמש בכלי Ngram Viewer ב-Google ספרים
כיצד להשתמש בכלי Ngram Viewer ב-Google ספרים
Anonim

מה צריך לדעת

  • ב-Google Books Ngram Viewer, הקלד ביטוי, בחר טווח תאריכים וקורפוס, הגדר את רמת ההחלקה ולחץ על Search lots of books.
  • אתה יכול להתעמק בנתונים. לדוגמה, כדי לחפש את צורת הפועל של fish, במקום שם העצם fish, השתמש בתג: חפש fish_VERB.
  • Ngram Viewer מפיק גרף המייצג את השימוש בביטוי לאורך זמן. עבור ביטויים מרובים, כל אחד מיוצג על ידי קו מקודד בצבע.

מאמר זה מסביר כיצד להשתמש בכלי Ngram Viewer ב-Google Books כדי לבצע מחקר וחיפושים מעמיקים.

Image
Image

איך פועל Ngram Viewer

An Ngram, הנקרא גם N-gram, הוא ניתוח סטטיסטי של תוכן טקסט או דיבור כדי למצוא n (מספר) של פריט כלשהו בטקסט.

פריט החיפוש יכול להיות כל מיני דברים, כולל פונמות, קידומות, ביטויים ואותיות. למרות ש-Ngram הוא מעורפל מחוץ לקהילת המחקר, הוא משמש במגוון תחומים ויש לו השלכות רבות על מפתחים המקודדים תוכנות מחשב שמבינות ומגיבות לשפה דיבור טבעית.

במקרה של Google Books Ngram Viewer, הטקסט שיש לנתח מגיע ממספר עצום של ספרים ברשות הרבים שגוגל סרקה כדי לאכלס את מנוע החיפוש שלה Google Books. עבור Google Books Ngram Viewer, Google מתייחסת לגוף הטקסט שאתה הולך לחפש בתור הקורפוס. Ngram Viewer מצטבר לפי שפה, אם כי ניתן לנתח בנפרד אנגלית בריטית ואמריקאית או לאחד אותם יחד.

  1. עבור אל Google Books Ngram Viewer בכתובת books.google.com/ngrams.
  2. הקלד כל ביטוי או ביטוי שברצונך לנתח. הפרד כל ביטוי בפסיק. גוגל מציעה, "אלברט איינשטיין, שרלוק הולמס, פרנקנשטיין" כדי להתחיל.

    בחיפושים של NGram Viewer, הפריטים הם תלויי רישיות, שלא כמו בחיפושים באינטרנט של Google.

  3. בחר טווח תאריכים. ברירת המחדל היא 1800 עד 2000.
  4. בחר קורפוס. אתה יכול לחפש טקסטים בשפה זרה או טקסטים באנגלית, ובנוסף לאפשרויות הסטנדרטיות, ייתכן שתבחין בערכים כגון "אנגלית (2009)" או "אנגלית אמריקאית (2009)" בתחתית הרשימה. אלו הם קורפוסים ישנים יותר שגוגל עדכנה מאז, אבל אולי יש לך סיבה כלשהי לבצע את ההשוואות שלך מול מערכי נתונים ישנים. רוב המשתמשים יכולים להתעלם מהם ולהתמקד בקורפוסים העדכניים ביותר.
  5. הגדר את רמת ההחלקה. החלקה מתייחסת למידת החלקה של הגרף בסופו. הייצוג המדויק ביותר משקף רמת החלקה של 0, אך הגדרה זו עשויה להיות קשה לקריאה. ברירת המחדל מוגדרת ל-3. ברוב המקרים, אין צורך להתאים אותה.
  6. לחץ חפש המון ספרים.

באמצעות Ngram Viewer של Google, אתה יכול להתעמק בנתונים. אם תרצה לחפש את הפועל דג במקום שם העצם דג, תוכל לעשות זאת באמצעות תגים. במקרה זה, תחפש fish_VERB.

Google מספקת רשימה מלאה של פקודות תיעוד מתקדם אחר לשימוש עם Ngram Viewer באתר האינטרנט שלה.

שורה התחתונה

Google Books Ngram Viewer מפיק גרף המייצג את השימוש בביטוי מסוים בספרים לאורך זמן. אם הזנת יותר ממילה או ביטוי אחד, כל אחד מהם מיוצג על ידי קו מקודד בצבע כדי להבדיל עם שאר מונחי החיפוש.זה דומה ל-Google Trends, רק החיפוש מכסה תקופה ארוכה יותר.

Case Study

שקול את המקרה של פשטידות חומץ. הם מוזכרים בסדרת "בית קטן בערבה" של לורה אינגלס ויילדר. חיפוש באמצעות חיפוש האינטרנט של גוגל כדי ללמוד עוד על פשטידות חומץ מגלה שהן נחשבות לחלק מהמטבח הדרום אמריקאי ואכן עשויות מחומץ. הם מקשיבים לזמנים שבהם לא לכולם הייתה גישה לתוצרת טרייה בכל עונות השנה, אבל האם זה כל הסיפור?

חפש ב-Google Ngram Viewer עבור עוגת חומץ, ותתקל בכמה אזכורים של העוגה גם בתחילת המאה ה-18 וגם בסוף המאה ה-19, הרבה אזכורים בשנות הארבעים ומספר הולך וגדל של אזכורים בתקופה האחרונה. עם זאת, עם רמת החלקה של 3, אתה רואה רמה מעל האזכורים בשנות ה-1800. מכיוון שלא התפרסמו הרבה ספרים במהלך אותה תקופה ומכיוון שהנתונים מוגדרים לחלקים, התמונה מעוותת. כנראה שרק ספר אחד הזכיר עוגת חומץ, והוא היה ממוצע כדי למנוע ספייק.על ידי הגדרת ההחלקה ל-0, אתה יכול לראות שזה בדיוק המקרה. השפיץ מתרכז ב-1869, ויש עלייה נוספת ב-1897 וב-1900.

לא סביר שאף אחד לא דיבר על עוגות חומץ בשאר הזמן: כנראה היו מתכונים שצפו בכל מקום, אבל אנשים לא כתבו עליהם בספרים, וזו מגבלה חשובה של חיפושי Ngram.

מוּמלָץ: