🔸یک رشته توییت کوتاه به همراه یک خواهش - نویسنده حامد سعیدی

🔸یک رشته توییت کوتاه به همراه یک خواهش - نویسنده حامد سعیدی

▫️دقایقی پیش، یکی از هیجان‌انگیزترین پروژه‌های crowdsource جامعه نرم‌افزاری ایران لانچ شد: بهبود برچسب‌های پیکره متنی موجودیت‌های نامی #فارسی به صورت #اپن‌سورس
این پیکره با ۲۵ میلیون توکن در قالب حدود یک میلیون جمله، نیازمند کمک شماست.

▫️همین اول بگم، کلیه فایل‌های پیکره در مخزن گیت‌هاب https://github.com/text-mining/persian-ner … در دسترس هستند و بعد از اصلاحات و بهبود و کمک شما، برچسب‌های به‌روز شده هم به صورت اپن‌سورس منتشر می‌شن.اما داستان چیه؟

▫️همه ما (چه برنامه‌نویس‌ها، چه پژوهشگران) برای اینکه ابزارهای مربوط به پردازش متن فارسی با دقت بالاتری کار کنند یک سری داده‌های اولیه نیاز داریم. این پیکره که از دیتای #ویکی‌پدیا فارسی گرفته شده و به صورت استاندارد برچسب‌گذاری شده، نیاز داره که برچسب‌هاش اصلاح و بهتر بشن.

▫️کافیه به آدرس http://app.text-mining.ir برید و ثبت‌نام کنید و وارد بشید و بعد به قسمت «برچسب متون NER» برید. یک جمله رندوم بهتون نشون داده می‌شه که طبق راهنما می‌تونید اصلاحش کنید. اسم شما در لیست مشارکت‌کنندگان نهایی پروژه خواهد بود ولو با یک برچسب :)

▫️من این افتخار رو داشتم که در کنار دوستان تیم متن‌کاوی باشم. بچه‌هایی از دانشگاه‌های شریف و تربیت مدرس و فردوسی که برای توسعه این ابزارها وقت گذاشتند. این سایت API های پردازش متن فارسی هم ارائه می‌کنه و به زودی ابزارهایی هم در دسترس علاقمندان خواهد بود

▫️متن اطلاعیه فراخوان مشارکت عمومی اینجاست. خواهشم اینه که بخونیدش و اگر فرصت و علاقه دارید مشارکت کنید. کاری که اینجا انجام می‌شه و اپن سورس در اختیار بقیه قرار می‌گیره می‌تونه پایه خیلی از ابزارهای کاربردی به زبان فارسی باشه.
http://text-mining.ir/ner-crowdsourcing/

▫️دو توضیح دیگه هم باید بدم. 1️⃣ اینکه ارائه لیست موجودیت‌ها به صورت جداگانه چندان مفید نیست. مثلاً “صیاد شیرازی” می‌تونه در جمله‌ای به یک خیابان (رده مکان) و در جمله‌ای دیگه به نام یک شخص (رده اشخاص) اشاره کنه و این پیکره با تگ‌های استاندارد قابل استفاده در الگوریتم‌ها آماده شده. 2️⃣ اینکه مشارکت همه شما در این پروژه crowdsource شده به رشد و بهبود دقت سریع‌ترش کمک می‌کنه. خواهش می‌کنم ضمن معرفی، فیدبک ارائه بدید و اگر سوالی دارید بپرسید.

▫️اگر در کار تولید #پلاگین #مرورگر هستید یا کسی رو می‌شناسید که فرصت ساخت پلاگین اپن‌سورس برای پروژه رو داره، منشن کنید

▫️لینک رشته توییت:
https://twitter.com/Hamed/status/1068198803797241856

◀️ عضویت در کانال @aoveissi