کتابخانه تخصصی ادبیات

۱۰۶۸

۳۴۹

پردازش زبان و گفتار: مقدمه‌ای بر پردازش زبان طبیعی، زبان‌شناسی رایانشی و پردازش گفتار

پدیدآور: دانیل ژورافسکی، جیمز مارتین ناشر: نویسه پارسیتاریخ چاپ: ۱۴۰۱مترجم: هادی ویسی و دیگران مکان چاپ: تهرانتیراژ: ۳۰۰شابک: 4ـ39ـ7386ـ622ـ978 تعداد صفحات: ۸۸۴

زبان‌شناسی تشخیص گفتار زبان و گفتار پردازش گفتار زبان‌شناسی رایانشی پردازش زبان طبیعی نشر نویسه پارسی دانیل ژورافسکی، جیمز مارتین

خلاصه

این کتاب در رابطه با یک حوزۀ میان‌رشته‌ای به نام «پردازش زبان و گفتار رایانه‌ای» است که آن را با نام‌های دیگری چون «فناوری زبان انسان»، «پردازش زبان طبیعی» یا «زبان‌شناسی رایانشی» نیز می‌شناسند. هدف از این حوزه، توانمندسازی رایانه‌ها برای انجام وظایفی است که زبان انسان جزئی از آن به حساب می‌آید. از جمله این وظایف می‌توان به امکان برقراری ارتباط میان انسان و ماشین، بهبود ارتباطات بین انسان‌ها یا پردازش متن و گفتار اشاره کرد.

معرفی کتاب

برای دیدن بخشی از صفحات کتاب، لینک فایل پی دی اف (pdf) را ببینید.

زمان کار برروی پردازش زبان گفتار فرارسیده است! حوزه‌هایی همچون پردازش زبان طبیعی، بازشناسی گفتار، زبان‌شناسی رایانشی، روان‌شناسی زبان‌شناسی رایانشی که در طول تاریخ به صورت مجزا در حال رشد بوده‌اند، اکنون در حال همگرایی و ادغام در یکدیگر هستند. رشد خیره‌کننده روش‌های زبانی مبتنی بر تلفن، تولید گفتار و بازشناسی گفتار، انگیزۀ قابل توجهی را برای توسعۀ سامانه‌های کاربردی بیشتر فراهم آورده‌اند. این در حالی است که دسترسی به پیکره‌های بسیار بزرگ برخط، توانایی ساخت مدل‌های آماری زبان در هر سطحی، از آواشناسی تا گفتمان را به وجود آورده است. روند مذکور در طراحی این کتاب در نظر گرفته شده است. این کتاب یکی از مراجع اصلی آموزشی در دنیا برای درس‌های حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است که توسط استادان شناخته‌شدۀ این حوزه در دانشگاه‌های استنفورد و کلرادو نوشته شده است. این کتاب در داخل کشور نیز، هم مورد استفاده استادان و دانشجویان دانشگاهه‌است؛ به‌ویژه در رشته‌های هوش مصنوعی و زبان‌شناسی رایانشی و هم توسط پژوهشگران برای یادگیری مطالب نظری و عملی در ساخت سامانه‌هایی مانند «ترجمۀ ماشینی»، «خطایاب املایی»، «موتورهای جستجو»، «پرسش و پاسخ»، «پایش شبکه‌ها و رسانه‌های اجتماعی»، «بازشناسی گفتار»، «تبدیل متن به گفتار»، «تشابه‌یابی متن و تشخیص سرقت علمی» و موارد مشابه به کار می‌رود. عدم وجود یک مرجع علمی منسجم فارسی برای آموزش در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی، کامل بودن مطالب این کتاب، پوشش مناسب مطالب نظری در کنار الگوریتم‌ها و روش‌های کاربردی و همچنین به‌روزبودن و به‌روزشدن مستمر مطالب کتاب، انگیزه کافی برای ترجمه این مرجع را فراهم کرده است.

اینکه نشان داده شود چطور الگوریتم‌ها و روش‌های پردازش زبان می‌توانند برای حل مسائل مهم دنیای واقعی به کار گرفته شوند، از اهمیت زیادی برخوردار است. از جمله این کاربردها عبارتند از: بازشناسی گفتار، ترجمۀ ماشینی، استخراج اطلاعات از وب، غلط‌یاب املایی، جستجوی سند متنی و مکالمه زبان گفتاری. در این راستا در این کتاب کوشیده شده تا متناسب با موضوع هر فصل به معرفی کاربردهای مختلف پردازش زبان پرداخته شود. مزیت این رویکرد در آن است که به محض معرفی دانش زبان‌شناسی مرتبط، دانشجویان پیش‌زمینۀ موردنیاز فهم و مدل‌سازی یک حوزۀ خاص را در اختیار خواهند داشت.

رویکردهای جدید پردازش زبان و گفتار مبتنی بر منابع رایج این حوزه هستند: پیکره‌های متنی و گفتاری خام، پیکره‌های حاشیه‌نویسی‌شده، درخت‌بانک‌ها و مجموعه‌های برچسب استاندارد. تلاش نویسندگان در این کتاب بر این بوده است که بسیاری از این منابع مهم را معرفی کنند. همچنین فهرست کاملی از بسیاری از مجموعه برچسب‌های مفید و الگوهای رمزگذاری فراهم شده است.

در بخش‌های ابتدایی کتاب، کلمات، مفاهیم مرتبط با پردازش کلمه و زنجیرۀ کلمات ساده معرفی شده است: تقطیع کلمه، ساخت‌واژۀ کلمه، فاصلۀ ویرایش کلمه، اجزای کلام و الگوریتم‌های استفاده‌شده برای پردازش آنها مانند عبارت‌های منظم، ماشین خودکار متناهی، مبدل‌های متناهی، Nـتایی‌ها، مدل‌های مخفی مارکول و مدل‌های لگاریتم خطی را بررسی می‌کند. در بخش بعدی گفتار، زبان‌شناسی آوایی را معرفی می‌کند. سپس تولید گفتار، بازشناسی گفتار و مباحث زبان‌شناسی حوزۀ واج‌شناسی رایانه‌ای پوشش شداده شده است. در بخش بعدی «نحو» دستورهای ساختار ـ عبارت را برای انگلیسی معرفی می‌کند و الگوریتم‌های موردنیاز را برای پردازش روابط نحوی ساخت‌یافته بین کلمات ارائه می‌دهد: الگوریتم‌های CKY و Earley برای تجزیه، تجزیۀ آماری، یکسان‌سازی و ساختارهای ویژگی طبقه‌بندی شده و ابزارهای تحلیلی مانند سلسله مراتب چامسکی و لم پمپاژ. در بخش بعدی «معنی‌شناسی و کاربردشناسی» به معرفی مواردی چون منطق مرتبۀ اول و روش‌های دیگر بازنمایی معنی، محاسبات لامبدا، معناشناسی واژگانی، منابع معناشناسی واژگانی (همچون وردنت، درخت‌بانک گزاره‌ای، فریم‌نت) و مدل‌های رایانشی معناشناسی واژگانی برای شباهت کلمه، ابهام‌زدایی حس کلمه و عنوان‌های تحلیل گفتار مانند مرجع و همبستگی می‌پردازد. در بخش پایانی کتاب «کاربردها» نیز استخراج اطلاعات، ترجمۀ ماشینی و عامل‌های گفتگو و مکالمه را پوشش می‌دهد.

فهرست مطالب کتاب:

پیش‌گفتار نویسنده‌ها

پیش‌گفتار مترجمان

فصل اول: مقدمه

فصل دوم: عبارت‌های منظم و ماشین‌های خودکار

فصل سوم: کلمات و مبدل‌ها

فصل چهارم: N ـ تایی‌ها

فصل پنجم: دسته‌های کلمات و برچسب‌زنی اجزای کلام

فصل ششم: مدل‌های مخفی مارکوف و آنتروپی بیشینه

فصل هفتم: آواشناسی

فصل هشتم: آواشناسی محاسباتی

فصل نهم: دستورهای صوری زبان انگلیسی

فصل دهم: تجزیه با دستورات مستقل از بافت

فصل یازدهم: تجزیۀ آماری

فصل دوازدهم: بازنمایی معنا

فصل سیزدهم: معناشناسی رایانشی

فصل چهاردهم: معنی‌شناسی واژگانی

فصل پانزدهم: معناشناسی واژگانی رایانشی

پیوست‌ها

نظر شما ۰ نظر

پربازدید ها بیشتر ...

پابرهنه در برادوی: زندگی و آثار نیل سایمون

مجید مصطفوی

نیل سایمون (1927 ـ 2018) یکی از پرکارترین، موفق‌ترین و محبوب‌ترین نمایشنامه‌نویسان جهان و یکی از بهت

زبان ملت، هستی ملت

امامعلی رحمان

زبان تاجیکستان با استقلال وطن پیوند ناگسستنی دارد؛ یعنی وقتی که وطن آزاد و مستقل بوده است، زبان هم ش