دانشگاه هاروارد و کمپانی گوگل میگویند راه تازهای را برای کاوش در زبان و تشخیص گرایشهای فرهنگی دویست سال اخیر به کمک زبان ابداع کردهاند.
مبنای تحقیقات آنها اطلاعات برگرفته شده از پنج میلیون نسخه کتابی است که توسط شرکت گوگل به شکل دیجیتال درآمده و در اختیار همگان قرار گرفته است.
به گزارش روزنامه گاردین چاپ بریتانیا، پروژه مشترک گوگل و محققان دانشگاه هاروارد با استفاده از بررسی کاربردی کلمات انگلیسی در متن بیش از پنج میلیون کتابی که در فاصله سالهای ۱۸۰۰ تا ۲۰۰۰ به چاپ رسیدهاند به علاقهمندان زبان و فرهنگ این امکان را خواهد داد که مسیر تحول کلمات کلیدی را تعقیب کرده و از این طریق شکلگیری مفاهیم، سبکها و گرایشهای فرهنگی را تشخیص دهند.
به گفته محققان دانشگاه هاروارد، از دهه ۱۹۵۰ ایده بررسی کمی و کیفی اطلاعات مربوط به علوم انسانی و علوم اجتماعی وجود داشته، اما مشکل اصلی جمعآوری و طبقهبندی اطلاعات موجود بوده است. اکنون با استفاده از نسخه دیجیتال پنج میلیون کتابی که در دو قرن اخیر به چاپ رسیدهاند میتوان ابزاری را خلق کرد که این بررسی را برای همگان ساده کند.
به نوشته روزنامه گاردین، محققان هاروارد در بررسیهای اولیه خود متوجه شدهاند که هر سال به طور متوسط هشت هزار و پانصد کلمه جدید وارد زبان انگلیسی میشود و دامنه لغات این زبان در فاصله سالهای ۱۹۵۰ تا ۲۰۰۰ حدود ۷۰ درصد افزایش یافته است. اما تمام این کلمات جدید به لغتنامههای زبان انگلیسی راه پیدا نمیکنند.
محققان دانشگاه هاروارد در مطلبی در توضیح ابداع تازه خود که این هفته در نشریه علمی «ساینس» به چاپ رسیده نوشتهاند: «ارزیابی ما نشان میدهد که حدود ۵۲ درصد از این کلمات که شامل بخش اعظم کلماتی میشوند که در کتابهای جدید مورد استفاده قرار گرفتهاند در منابع متعارف زبانشناسی و فرهنگهای لغت ثبت نمیشوند.»
یکی از کارهای دیگری که این پژوهشگران با استفاده از ابزار جستجوگر جدید خود انجام دادهاند بررسی روند تغییر کلمات است. یک نمونه آن جایگزین کردن افعال بیقاعده با شکل باقاعده آن در زبان انگلیسی رایج در آمریکاست.
گاردین میافزاید که یک نکته دیگر در نتیجه بررسی روند تغییر زبان و کلمات این بوده که مفهوم شهرت و یافتن شهرت با گذشت زمان تغییر کرده است. برای مثال، افراد مشهور در قرن نوزدهم معمولا در حوالی سن چهل و چند سالگی به شهرت رسیده و این موقعیت خود را برای مدتی طولانی حفظ میکردند. اما در نیمه دوم قرن بیستم متوسط سن افرادی که به شهرت رسیدند حدود ۳۰ سال بوده، ولی در مقابل دوران شهرت آنها کوتاهتر بوده است.
در زمینه شهرت نکته جالب دیگری که به دست آمده این است که پیشرفت در علم هیچ گاه بهترین راه برای کسب شهرت نبوده است. بسیاری از دانشمندان پس از مدتی بسیار طولانی به شهرتی مشابه شهرت هنرپیشههای سینما میرسند. و در میان شخصیتهای دنیای علوم به نظر میرسد که نام فروید بیش از هر کس دیگری از جمله داروین، گالیله یا اینشتین در کتابهای دو قرن اخیر ذکر شده است.
به نوشته روزنامه گاردین، یکی دیگر از دستاوردهای این ابزار و گنجینه اطلاعاتی جديد که گوگل در اختیار همگان خواهد گذاشت توانایی تشخیص روند سانسور کتاب و نشریات در کشورهای مختلف است. برای مثال، با مرور کتابهای دوره سلطه نازیها بر آلمان میتوان دید که در تمام این مدت ده ساله نام بسیاری از بزرگان عالم هنر و فرهنگ که ریشه یهودی داشتهاند بسیار به ندرت در جایی ذکر شده است.
نمونههای واضح دیگر از سانسور دولتی سالهای پس از حادثه میدان تیانآنمن در چین یا حذف نام لئون تروتسکی از بسیاری منابع منتشر شده در روسیه و اتحاد جماهیر شوروی سابق است.
روزنامه گاردین در پایان میافزاید که همزمان با این پژوهشها کمپانی گوگل نیز ابزار جدیدی را در اختیار کاربران خود قرار داده که به وسیله آن میتوان تعداد دفعات کاربرد هر کلمه انگلیسی در متن پنج میلیون کتاب را به دست آورد و حتی از چگونگی تغییر مفهومی یا کاربردی این کلمات با گذشت زمان مطلع شد.
مبنای تحقیقات آنها اطلاعات برگرفته شده از پنج میلیون نسخه کتابی است که توسط شرکت گوگل به شکل دیجیتال درآمده و در اختیار همگان قرار گرفته است.
به گزارش روزنامه گاردین چاپ بریتانیا، پروژه مشترک گوگل و محققان دانشگاه هاروارد با استفاده از بررسی کاربردی کلمات انگلیسی در متن بیش از پنج میلیون کتابی که در فاصله سالهای ۱۸۰۰ تا ۲۰۰۰ به چاپ رسیدهاند به علاقهمندان زبان و فرهنگ این امکان را خواهد داد که مسیر تحول کلمات کلیدی را تعقیب کرده و از این طریق شکلگیری مفاهیم، سبکها و گرایشهای فرهنگی را تشخیص دهند.
به گفته محققان دانشگاه هاروارد، از دهه ۱۹۵۰ ایده بررسی کمی و کیفی اطلاعات مربوط به علوم انسانی و علوم اجتماعی وجود داشته، اما مشکل اصلی جمعآوری و طبقهبندی اطلاعات موجود بوده است. اکنون با استفاده از نسخه دیجیتال پنج میلیون کتابی که در دو قرن اخیر به چاپ رسیدهاند میتوان ابزاری را خلق کرد که این بررسی را برای همگان ساده کند.
به نوشته روزنامه گاردین، محققان هاروارد در بررسیهای اولیه خود متوجه شدهاند که هر سال به طور متوسط هشت هزار و پانصد کلمه جدید وارد زبان انگلیسی میشود و دامنه لغات این زبان در فاصله سالهای ۱۹۵۰ تا ۲۰۰۰ حدود ۷۰ درصد افزایش یافته است. اما تمام این کلمات جدید به لغتنامههای زبان انگلیسی راه پیدا نمیکنند.
محققان دانشگاه هاروارد در مطلبی در توضیح ابداع تازه خود که این هفته در نشریه علمی «ساینس» به چاپ رسیده نوشتهاند: «ارزیابی ما نشان میدهد که حدود ۵۲ درصد از این کلمات که شامل بخش اعظم کلماتی میشوند که در کتابهای جدید مورد استفاده قرار گرفتهاند در منابع متعارف زبانشناسی و فرهنگهای لغت ثبت نمیشوند.»
یکی از کارهای دیگری که این پژوهشگران با استفاده از ابزار جستجوگر جدید خود انجام دادهاند بررسی روند تغییر کلمات است. یک نمونه آن جایگزین کردن افعال بیقاعده با شکل باقاعده آن در زبان انگلیسی رایج در آمریکاست.
گاردین میافزاید که یک نکته دیگر در نتیجه بررسی روند تغییر زبان و کلمات این بوده که مفهوم شهرت و یافتن شهرت با گذشت زمان تغییر کرده است. برای مثال، افراد مشهور در قرن نوزدهم معمولا در حوالی سن چهل و چند سالگی به شهرت رسیده و این موقعیت خود را برای مدتی طولانی حفظ میکردند. اما در نیمه دوم قرن بیستم متوسط سن افرادی که به شهرت رسیدند حدود ۳۰ سال بوده، ولی در مقابل دوران شهرت آنها کوتاهتر بوده است.
در زمینه شهرت نکته جالب دیگری که به دست آمده این است که پیشرفت در علم هیچ گاه بهترین راه برای کسب شهرت نبوده است. بسیاری از دانشمندان پس از مدتی بسیار طولانی به شهرتی مشابه شهرت هنرپیشههای سینما میرسند. و در میان شخصیتهای دنیای علوم به نظر میرسد که نام فروید بیش از هر کس دیگری از جمله داروین، گالیله یا اینشتین در کتابهای دو قرن اخیر ذکر شده است.
به نوشته روزنامه گاردین، یکی دیگر از دستاوردهای این ابزار و گنجینه اطلاعاتی جديد که گوگل در اختیار همگان خواهد گذاشت توانایی تشخیص روند سانسور کتاب و نشریات در کشورهای مختلف است. برای مثال، با مرور کتابهای دوره سلطه نازیها بر آلمان میتوان دید که در تمام این مدت ده ساله نام بسیاری از بزرگان عالم هنر و فرهنگ که ریشه یهودی داشتهاند بسیار به ندرت در جایی ذکر شده است.
نمونههای واضح دیگر از سانسور دولتی سالهای پس از حادثه میدان تیانآنمن در چین یا حذف نام لئون تروتسکی از بسیاری منابع منتشر شده در روسیه و اتحاد جماهیر شوروی سابق است.
روزنامه گاردین در پایان میافزاید که همزمان با این پژوهشها کمپانی گوگل نیز ابزار جدیدی را در اختیار کاربران خود قرار داده که به وسیله آن میتوان تعداد دفعات کاربرد هر کلمه انگلیسی در متن پنج میلیون کتاب را به دست آورد و حتی از چگونگی تغییر مفهومی یا کاربردی این کلمات با گذشت زمان مطلع شد.