ارنواز

پالایشگر نوشتار فارسی از واژگان بیگانه

ارنواز هنوز آماده نیست

ارنواز کیست؟

«ارنواز با بهره‌گیری از روش‌های یادگیری ماشین جمله‌های فارسی را از واژگان بیگانه پالایش می‌کند»

چگونه آموزش دیده؟

ارنواز با به کارگیری «گردآورد داده‌های ارنواز» آموزش دیده است

با چه ساخته شده؟

ارنواز با بهره‌گیری از «مدل بلبل‌زبان» ساخته شده است

چه میخواد بکند؟

ارنواز تلاش میکند نوشته‌ها را پَرسون‌، ساده‌ و فهمیدنی‌تر کند

چرا پالایش نوشتار فارسی؟

احمد کسروی:

درآمیختگی و بیمرزی، زبان فارسی را از جداسری بی‌بهره گردانیده بود. زیرا زبان با آنحال اگر کسانی خواستندی یاد بگیرند، بایستی گذشته از واژه‌های فارسی و دستور این زبان، واژه‌های عربی و صرف و نحو آن زبان را نیز یاد بگیرند. خود ایرانیان که فارسی زبان مادرزادیشان شمرده میشد، برای یادگرفتن آن میبایست عربی نیز درس خوانده و آنرا نیز بیاموزند. ایرانیان تا بیست و سی سال پیش درس عربی میخواندند و با آنکه سالها در آن راه رنج میبردند، باز در بسیاری از واژه‌ها دچار لغزش میشدند (چنانکه «کافی» را «مکفی» و «منجی» را «ناجی» و «آیس» را «مایوس» مینوشتند). از آنسوی مردم عامی که بعربی بیگانه میبودند، از این زبان هیچی نمیفهمیدند و کمترین بهره از نوشته‌ها و کتابها نمیبردند. کسانی که در برابر ما ایستاده میگفتند:«گرفتن واژه عربی چه زیان دارد؟» همانا اینها را نمیاندیشیدند. و گرنه خود زیان بزرگیست که فارسی را که یکی از آسانترین زبانهاست، چندان دشوار گردانیم که کمتر کسی از بیرون بآموختن آن گراید و از درون نیز انبوه ایرانیان از فهمیدن آن بی‌بهره باشند. من بارها از اروپاییان که بایران آمده‌اند شنیده‌ام که از یادگرفتن فارسی چشم پوشیده‌اند، چرا که بایستی عربی را نیز یاد گیرند و سالها رنج کشند

-زبان پاک

محمد حیدری ملایری:

سره گرایی عبارت است از خودداری از به کار بردن واژه‌های بیگانه، به ویژه واژه‌های عربی، و جایگزین کردن آن ها با واژه‌های فارسی. ویژگی عمده سره‌گرایی راندن واژه‌های عربیست، تنها به این دلیل که عربی‌اند. بی آنکه این کار بر پایه‌ی برآورد زبانیک همه‌جانبه‌ای استوار باشد. در برابر سره‌گویی گرایش دیگری هست که میتوان به آن «فارسی گویی» گفت، نه سره‌گرایی. میانه روست، بدین معنا که باید به فارسی برتری داد ولی واژه‌های عربی که در فارسی به کار میروند فارسی شده‌اند و نباید آنها را کنار گذاشت. به ویژه این که ادبیات کلاسیک فارسی با آنها نوشته شده است. گرچه هر یک از این دو گرایش جنبه‌های مثبت دارد که میتوان پذیرفت، هیچ‌یک به مسئله‌ی واقعی زبان فارسی نمیپردازد، چنان که خواهد آمد. پیش از آنکه ادامه بدهیم، گرایش سومی هم هست که معتقد است نباید در زبان دخالت کرد. باید گزاشت زبان به گونه‌ی زاستاری (طبیعی) تحول یابد. این گرایش سوم بسیار از واقعیت به دور است و سخت بوی کهنگی میدهد. قبلا در این رشته برنامه‌ها گفته‌ام که در واقع زبان زاستاری وجود ندارد و هیچ زبان توانمندی نیست که در آن دخالت هوشمندانه نشده باشد. گفتم که زبان‌های اروپایی بر اثر دخالت و تصمیم نویسندگان و اندیشمندان و دانشمندان پس از سده‌ی هفدهم به توانایی کنونی خود رسیده‌اند. همچنین گفتم که زبان آلمانی زبانیست نیمه مصنوعی. زبان نروژی نوین کاملا ساختگیست. این درباره‌ی زبان‌های همگانی و ادبیست که با آنها داستان مینویسند، ‌شعر میسرایند و طنز می‌پردازند وگرنه زبان دانشهای دقیق جای خود دارد. این زبان‌ها همه ساختگی یا مصنوعی‌اند. همچنین گفتم که ناتوانی‌های کنونی زبان فارسی در اثر تحمیل عربی به فارسی بوده است، نه فرگشت زاستاری فارسی. از این گذشته،‌توانمندتر شدن فارسی پس از مشروطه بر اثر کار و کوشش ارادی ایرانیان بوده که کوشیده‌اند فارسی را از زیر سلطه‌ی عربی بیرون بیاورند. پس بیش از این وقت صرف این گرایش سوم نکنیم. برگردیم به سره‌گرایی. در این شک نیست که سره‌گرایی از فارسی‌خواهی و ایران‌دوستی برمیخیزد که بسیار ستودنی و پرارج است. سره‌گرایی همچنین فریاد اعتراضیست که بیدادی ویرانگر که زبان عربی در طول سده‌ها بر فارسی رانده است. کوششیست برای پدافند از فارسی. با این همه سره‌گرایی جنبه‌های منفی هم دارد. از جمله در بسیاری مورد‌ها ریزه‌کاری‌ها و ساین‌ها (نوانس‌ها)ی زبان و جنبه‌های گوناگون دانش‌های زبانیک و ازداییک (دانش اطلاعات) را در نظر نمیگیرد و به نیاز‌های واقعی زبان فارسی برای اندیشیدن پرسون (دقیق) توجه بایسته ندارد. پرسش این است که اگر ما واژه‌های عربی را که در فارسی وجود دارند کنار بگذاریم و به جای آنها برابرهای فارسی بگذاریم، مسئله‌های زبانی ما حل میشوند؟ پاسخ این است که اگر این برابرگذاری‌ها سنجیده و ژرف باشند سودمند توانند بود. ولی مسئله‌ی فارسی تنها وجود بیش از حد واژه‌های عربی نیست. آیا اگر برای نمونه در فارسی «عشق» را به کار نبریم و به جای آن «مهر» بگوییم فارسی را تواناتر کرده‌ایم؟ نه،‌ چون «عشق» و «مهر» یکی نیستند، دو بگرت (مفهوم) متفاوتند. دوم آنکه «عشق» واژه‌ایست ایرانی، نه عربی. من این موضوع را در وتاری (مقاله‌ای)‌ باز نموده ام. میتوانید آن را در اینترنت پیدا کنید. به کار بردن تنها یک واژه برای «مهر» و «عشق» اندیشه‌ی فارسی زبان را ناتوان و نزار (ضعیف) میسازد. همچنین آیا باید واژه‌ی «جاده» را به کار نبریم و به جای آن بگوییم «راه» یا «گذر»؟ نه، چون «جاده» و «راه» و «گذر» سه بگرت جداگانه را میرسانند. در انگلیسی «Road»، «Way» و «Passage». در انگلیسی نزدیک به ۱۰ واژه‌ی دیگر ساین‌های گوناگون «راه» را میرسانند. مانند «Path»، «Trajectory»، «Circuit»، «Track»،‌ «Trail»، «Rout»، «Itinerary». بیشتر اینها در فیزیک هر یک معنای ویژه‌ی خود را دارد و ما باید در فارسی بکوشیم برای هر یک از این واژه‌ها برابر جداگانه‌ای داشته باشیم. نه این که با یکی دو واژه همه‌ی آنها را بیان کنیم. البته در بسیاری موردها به آسانی میتوان به جای عربی واژه‌ی فارسی مناسبی را به کار برد. بی آنکه مسئله‌ای باشد. برای نمونه، به جای «ضرر»، «زیان». به جای «منفعت»، «سود».«عمیق»، «ژرف». «عریض»، «پهن». «احتیاج»، «نیاز». «نجوم»، «اخترشناسی» و سدها مورد دیگر. از مهم‌ترین مسئله‌هایی که فارسی با آن دست به گریبان است، میتوان ولنگاری یا ضعف روشمندی و کمبود دقت را نام برد.از آنجا که فارسی زیر سلطه‌ی عربی بوده، سازوکارهای روشمند آن فلج شده اند. و چون بیشتر زبان شعر بوده به دقت چندانی نیاز نداشته است. نادیده گرفتن دقت در سره‌گرایی پیامدش زبانی خواهد شد از آنچه هست نادقیق‌تر. که در آن شمار کمی واژه‌ی فارسی هر یک چند معنا دارند. از زبان فارسی بسیار بیشتر از اینها باید انتظار داشت. آیا ما باید مصدرهای «فهمیدن» و «رقصیدن» و «بلعیدن» را کنار بگذاریم، چون ریشه‌ی عربی دارند؟ به هیچ روی. فارسی این واژه‌های عربی را کاملا از آن خود کرده است. اینها از کمیاب‌ترین موردهایی‌اند که فارسی چنان که میبایست کرده و از واژه‌های بیگانه مصدر ساخته است. حال ما به جای آفرین گفتن به فارسی میخواهیم این مصدرها را به دور بیاندازیم؟

-رشته برنامه‌های «دانش، اندیشه، زبان»

محمدعلی فروغی:

به‌ عقیده‌ من‌ امروز ایرانی‌ به‌ واسطه‌ی‌ این‌ که‌ در گذشته‌ فکرش‌ همواره‌ مشغول‌ به‌ عربی‌ بوده‌ و اکنون‌ به‌ زبان‌های‌ اروپایی‌ گرفتار و در آن‌ مستغرق‌ گردیده‌ است‌، با زبان‌ فارسی‌ بیگانه‌ است‌ و قوه‌ی‌ تصرف‌ و لغت‌‌سازی‌ همواره‌ متوجه‌ به‌ الفاظ‌ عربی‌ است‌ و اگر با عربی‌ هم‌ آشنا نباشد، گرفتار تعبیرات‌ اروپایی‌ است‌ و در هر حال‌ فارسی‌ نمی‌داند. پس‌ اول‌ باید یک‌ مدت‌ ذهن‌ خود را به‌ فارسی‌ صحیح‌ فصیح‌ مأنوس‌ سازد و ورزش‌ دهد تا کم‌‌کم‌ این‌ قوه‌ را دریابد و در آن‌ هنگام‌ به‌ مقصودی‌ که‌ در این‌ فصل‌ دنبال‌ می‌کنیم‌ به‌ خوبی‌ و آسانی‌ خواهد رسید