ابزار جدید گوگل برای کاوش در فرهنگ و زبان انگلیسی

دانشگاه هاروارد و کمپانی گوگل می‌گویند راه تازه‌ای را برای کاوش در زبان و تشخیص گرایش‌های فرهنگی دویست سال اخیر به کمک زبان ابداع کرده‌اند.

مبنای تحقیقات آنها اطلاعات برگرفته شده از پنج میلیون نسخه کتابی است که توسط شرکت گوگل به شکل دیجیتال درآمده و در اختیار همگان قرار گرفته است.

به گزارش روزنامه گاردین چاپ بریتانیا، پروژه مشترک گوگل و محققان دانشگاه هاروارد با استفاده از بررسی کاربردی کلمات انگلیسی در متن بیش از پنج میلیون کتابی که در فاصله سال‌های ۱۸۰۰ تا ۲۰۰۰ به چاپ رسیده‌اند به علاقه‌مندان زبان و فرهنگ این امکان را خواهد داد که مسیر تحول کلمات کلیدی را تعقیب کرده و از این طریق شکل‌گیری مفاهیم، سبک‌ها و گرایش‌های فرهنگی را تشخیص دهند.

به گفته محققان دانشگاه هاروارد، از دهه ۱۹۵۰ ایده بررسی کمی و کیفی اطلاعات مربوط به علوم انسانی و علوم اجتماعی وجود داشته، اما مشکل اصلی جمع‌آوری و طبقه‌بندی اطلاعات موجود بوده است. اکنون با استفاده از نسخه دیجیتال پنج میلیون کتابی که در دو قرن اخیر به چاپ رسیده‌اند می‌توان ابزاری را خلق کرد که این بررسی را برای همگان ساده کند.

به نوشته روزنامه گاردین، محققان هاروارد در بررسی‌های اولیه خود متوجه شده‌اند که هر سال به طور متوسط هشت هزار و پانصد کلمه جدید وارد زبان انگلیسی می‌شود و دامنه لغات این زبان در فاصله سال‌های ۱۹۵۰ تا ۲۰۰۰ حدود ۷۰ درصد افزایش یافته است. اما تمام این کلمات جدید به لغت‌نامه‌های زبان انگلیسی راه پیدا نمی‌کنند.

محققان دانشگاه هاروارد در مطلبی در توضیح ابداع تازه خود که این هفته در نشریه علمی «ساینس» به چاپ رسیده نوشته‌اند: «ارزیابی ما نشان می‌دهد که حدود ۵۲ درصد از این کلمات که شامل بخش اعظم کلماتی می‌شوند که در کتاب‌های جدید مورد استفاده قرار گرفته‌اند در منابع متعارف زبان‌شناسی و فرهنگ‌های لغت ثبت نمی‌شوند.»

یکی از کارهای دیگری که این پژوهشگران با استفاده از ابزار جستجوگر جدید خود انجام داده‌اند بررسی روند تغییر کلمات است. یک نمونه آن جایگزین کردن افعال بی‌قاعده با شکل باقاعده آن در زبان انگلیسی رایج در آمریکاست.

گاردین می‌افزاید که یک نکته دیگر در نتیجه بررسی روند تغییر زبان و کلمات این بوده که مفهوم شهرت و یافتن شهرت با گذشت زمان تغییر کرده است. برای مثال، افراد مشهور در قرن نوزدهم معمولا در حوالی سن چهل و چند سالگی به شهرت رسیده و این موقعیت خود را برای مدتی طولانی حفظ می‌کردند. اما در نیمه دوم قرن بیستم متوسط سن افرادی که به شهرت رسیدند حدود ۳۰ سال بوده، ولی در مقابل دوران شهرت آنها کوتاه‌تر بوده است.

در زمینه شهرت نکته جالب دیگری که به دست آمده این است که پیشرفت در علم هیچ گاه بهترین راه برای کسب شهرت نبوده است. بسیاری از دانشمندان پس از مدتی بسیار طولانی‌ به شهرتی مشابه شهرت هنرپیشه‌های سینما می‌رسند. و در میان شخصیت‌های دنیای علوم به نظر می‌رسد که نام فروید بیش از هر کس دیگری از جمله داروین، گالیله یا اینشتین در کتاب‌های دو قرن اخیر ذکر شده است.

به نوشته روزنامه گاردین، یکی دیگر از دستاوردهای این ابزار و گنجینه اطلاعاتی جديد که گوگل در اختیار همگان خواهد گذاشت توانایی تشخیص روند سانسور کتاب و نشریات در کشورهای مختلف است. برای مثال، با مرور کتاب‌های دوره سلطه نازی‌ها بر آلمان می‌توان دید که در تمام این مدت ده ساله نام بسیاری از بزرگان عالم هنر و فرهنگ که ریشه یهودی داشته‌اند بسیار به ندرت در جایی ذکر شده است.

نمونه‌های واضح دیگر از سانسور دولتی سال‌های پس از حادثه میدان تیان‌آن‌من در چین یا حذف نام لئون تروتسکی از بسیاری منابع منتشر شده در روسیه و اتحاد جماهیر شوروی سابق است.

روزنامه گاردین در پایان می‌افزاید که همزمان با این پژوهش‌ها کمپانی گوگل نیز ابزار جدیدی را در اختیار کاربران خود قرار داده که به وسیله آن می‌توان تعداد دفعات کاربرد هر کلمه انگلیسی در متن پنج میلیون کتاب را به دست آورد و حتی از چگونگی تغییر مفهومی یا کاربردی این کلمات با گذشت زمان مطلع شد.