پردازش زبان و گفتار: مقدمهای بر پردازش زبان طبیعی، زبانشناسی رایانشی و پردازش گفتار
خلاصه
این کتاب در رابطه با یک حوزۀ میانرشتهای به نام «پردازش زبان و گفتار رایانهای» است که آن را با نامهای دیگری چون «فناوری زبان انسان»، «پردازش زبان طبیعی» یا «زبانشناسی رایانشی» نیز میشناسند. هدف از این حوزه، توانمندسازی رایانهها برای انجام وظایفی است که زبان انسان جزئی از آن به حساب میآید. از جمله این وظایف میتوان به امکان برقراری ارتباط میان انسان و ماشین، بهبود ارتباطات بین انسانها یا پردازش متن و گفتار اشاره کرد.معرفی کتاب
برای دیدن بخشی از صفحات کتاب، لینک فایل پی دی اف (pdf) را ببینید.
زمان کار برروی پردازش زبان گفتار فرارسیده است! حوزههایی همچون پردازش زبان طبیعی، بازشناسی گفتار، زبانشناسی رایانشی، روانشناسی زبانشناسی رایانشی که در طول تاریخ به صورت مجزا در حال رشد بودهاند، اکنون در حال همگرایی و ادغام در یکدیگر هستند. رشد خیرهکننده روشهای زبانی مبتنی بر تلفن، تولید گفتار و بازشناسی گفتار، انگیزۀ قابل توجهی را برای توسعۀ سامانههای کاربردی بیشتر فراهم آوردهاند. این در حالی است که دسترسی به پیکرههای بسیار بزرگ برخط، توانایی ساخت مدلهای آماری زبان در هر سطحی، از آواشناسی تا گفتمان را به وجود آورده است. روند مذکور در طراحی این کتاب در نظر گرفته شده است. این کتاب یکی از مراجع اصلی آموزشی در دنیا برای درسهای حوزۀ پردازش زبان طبیعی و زبانشناسی رایانشی است که توسط استادان شناختهشدۀ این حوزه در دانشگاههای استنفورد و کلرادو نوشته شده است. این کتاب در داخل کشور نیز، هم مورد استفاده استادان و دانشجویان دانشگاههاست؛ بهویژه در رشتههای هوش مصنوعی و زبانشناسی رایانشی و هم توسط پژوهشگران برای یادگیری مطالب نظری و عملی در ساخت سامانههایی مانند «ترجمۀ ماشینی»، «خطایاب املایی»، «موتورهای جستجو»، «پرسش و پاسخ»، «پایش شبکهها و رسانههای اجتماعی»، «بازشناسی گفتار»، «تبدیل متن به گفتار»، «تشابهیابی متن و تشخیص سرقت علمی» و موارد مشابه به کار میرود. عدم وجود یک مرجع علمی منسجم فارسی برای آموزش در حوزۀ پردازش زبان طبیعی و زبانشناسی رایانشی، کامل بودن مطالب این کتاب، پوشش مناسب مطالب نظری در کنار الگوریتمها و روشهای کاربردی و همچنین بهروزبودن و بهروزشدن مستمر مطالب کتاب، انگیزه کافی برای ترجمه این مرجع را فراهم کرده است.
این کتاب در رابطه با یک حوزۀ میانرشتهای به نام «پردازش زبان و گفتار رایانهای» است که آن را با نامهای دیگری چون «فناوری زبان انسان»، «پردازش زبان طبیعی» یا «زبانشناسی رایانشی» نیز میشناسند. هدف از این حوزه، توانمندسازی رایانهها برای انجام وظایفی است که زبان انسان جزئی از آن به حساب میآید. از جمله این وظایف میتوان به امکان برقراری ارتباط میان انسان و ماشین، بهبود ارتباطات بین انسانها یا پردازش متن و گفتار اشاره کرد.
اینکه نشان داده شود چطور الگوریتمها و روشهای پردازش زبان میتوانند برای حل مسائل مهم دنیای واقعی به کار گرفته شوند، از اهمیت زیادی برخوردار است. از جمله این کاربردها عبارتند از: بازشناسی گفتار، ترجمۀ ماشینی، استخراج اطلاعات از وب، غلطیاب املایی، جستجوی سند متنی و مکالمه زبان گفتاری. در این راستا در این کتاب کوشیده شده تا متناسب با موضوع هر فصل به معرفی کاربردهای مختلف پردازش زبان پرداخته شود. مزیت این رویکرد در آن است که به محض معرفی دانش زبانشناسی مرتبط، دانشجویان پیشزمینۀ موردنیاز فهم و مدلسازی یک حوزۀ خاص را در اختیار خواهند داشت.
رویکردهای جدید پردازش زبان و گفتار مبتنی بر منابع رایج این حوزه هستند: پیکرههای متنی و گفتاری خام، پیکرههای حاشیهنویسیشده، درختبانکها و مجموعههای برچسب استاندارد. تلاش نویسندگان در این کتاب بر این بوده است که بسیاری از این منابع مهم را معرفی کنند. همچنین فهرست کاملی از بسیاری از مجموعه برچسبهای مفید و الگوهای رمزگذاری فراهم شده است.
در بخشهای ابتدایی کتاب، کلمات، مفاهیم مرتبط با پردازش کلمه و زنجیرۀ کلمات ساده معرفی شده است: تقطیع کلمه، ساختواژۀ کلمه، فاصلۀ ویرایش کلمه، اجزای کلام و الگوریتمهای استفادهشده برای پردازش آنها مانند عبارتهای منظم، ماشین خودکار متناهی، مبدلهای متناهی، Nـتاییها، مدلهای مخفی مارکول و مدلهای لگاریتم خطی را بررسی میکند. در بخش بعدی گفتار، زبانشناسی آوایی را معرفی میکند. سپس تولید گفتار، بازشناسی گفتار و مباحث زبانشناسی حوزۀ واجشناسی رایانهای پوشش شداده شده است. در بخش بعدی «نحو» دستورهای ساختار ـ عبارت را برای انگلیسی معرفی میکند و الگوریتمهای موردنیاز را برای پردازش روابط نحوی ساختیافته بین کلمات ارائه میدهد: الگوریتمهای CKY و Earley برای تجزیه، تجزیۀ آماری، یکسانسازی و ساختارهای ویژگی طبقهبندی شده و ابزارهای تحلیلی مانند سلسله مراتب چامسکی و لم پمپاژ. در بخش بعدی «معنیشناسی و کاربردشناسی» به معرفی مواردی چون منطق مرتبۀ اول و روشهای دیگر بازنمایی معنی، محاسبات لامبدا، معناشناسی واژگانی، منابع معناشناسی واژگانی (همچون وردنت، درختبانک گزارهای، فریمنت) و مدلهای رایانشی معناشناسی واژگانی برای شباهت کلمه، ابهامزدایی حس کلمه و عنوانهای تحلیل گفتار مانند مرجع و همبستگی میپردازد. در بخش پایانی کتاب «کاربردها» نیز استخراج اطلاعات، ترجمۀ ماشینی و عاملهای گفتگو و مکالمه را پوشش میدهد.
فهرست مطالب کتاب:
پیشگفتار نویسندهها
پیشگفتار مترجمان
فصل اول: مقدمه
فصل دوم: عبارتهای منظم و ماشینهای خودکار
فصل سوم: کلمات و مبدلها
فصل چهارم: N ـ تاییها
فصل پنجم: دستههای کلمات و برچسبزنی اجزای کلام
فصل ششم: مدلهای مخفی مارکوف و آنتروپی بیشینه
فصل هفتم: آواشناسی
فصل هشتم: آواشناسی محاسباتی
فصل نهم: دستورهای صوری زبان انگلیسی
فصل دهم: تجزیه با دستورات مستقل از بافت
فصل یازدهم: تجزیۀ آماری
فصل دوازدهم: بازنمایی معنا
فصل سیزدهم: معناشناسی رایانشی
فصل چهاردهم: معنیشناسی واژگانی
فصل پانزدهم: معناشناسی واژگانی رایانشی
پیوستها
پربازدید ها بیشتر ...
پابرهنه در برادوی: زندگی و آثار نیل سایمون
مجید مصطفوینیل سایمون (1927 ـ 2018) یکی از پرکارترین، موفقترین و محبوبترین نمایشنامهنویسان جهان و یکی از بهت
زبان ملت، هستی ملت
امامعلی رحمانزبان تاجیکستان با استقلال وطن پیوند ناگسستنی دارد؛ یعنی وقتی که وطن آزاد و مستقل بوده است، زبان هم ش
نظری یافت نشد.