پیکره بیجنخان یک پیکرهٔ برچسبگذاریشده است که برای تحقیق پردازش زبان طبیعی در زبان فارسی مناسب است. این مجموعه از اخبار و متون عمومی گردآوری شدهاست. در این مجموعه، تمام مستندات بر حسب موضوعات و بر اساس حدود ۴۳۰۰ موضوع مانند سیاسی، فرهنگی و غیره طبقهبندی شدهاند. این پیکره دربرگیرندهٔ نزدیک به ۲٫۶ میلیون کلمه است که به صورت دستی برچسبگذاری شدهاند.[۱]
پیکرهٔ بیجنخان توسط گروه تحقیقات پایگاه داده در دانشگاه تهران ایجاد شدهاست. این پیکره برای مصارف تجاری رایگان نیست؛ با این حال، این محدودیتها برای همهٔ کشورها یکسان نیست. این پیکره، به افتخار محمود بیجنخان، استاد زبانشناسی دانشگاه تهران و خدمات او در این زمینه، چنین نامگذاری شدهاست.
پیوند به بیرون
|
|---|
پیکرههای متنی، انگلیسی |
- پیکرهٔ ملی آمریکا
- بانک زبان انگلیسی
- پیکرهٔ برگن ویژهٔ زبان نوجوانان لندن
- پیکرهٔ ملی بریتانیا
- پیکرهٔ براون
- پیکرهٔ باکای
- پیکرهٔ انگلیسی کمبریج
- پیکره انگلیسی آمریکایی معاصر
- پیکرهٔ اِنرون
- مجموعهپیکرههای دهده
- پیکرهٔ بینالمللی انگلیسی
- پیکرهٔ لنکستر–اسلو–برگن
- پیکرهٔ انگلیسی آکسفورد
- پراپبَنک
- پیکرهٔ گفتاریِ انگلیسی
- تیآیامآیتی
- وِربنِت
- پیکرهٔ ولینگتون انگلیسی گفتاری نیوزیلند، ولینگتون
|
|---|
پیکرههای متنی، غیرانگلیسی |
- پیکره بیجنخان
- پیکرهٔ چایلدز
- پیکرهٔ زبان کرواتی
- پیکرهٔ ملی زبان کرواتی
- پیکرهٔ ملی چکی
- پیکرهٔ یوروپارل
- پیکرهٔ مرجع آلمانی
- پیکرهٔ همشهری
- پیکرهٔ ملی لهستانی
- طرح پیکرهٔ متنی آشوری نو
- پیکره گفتاری فارسی
- پیکرهٔ عربی قرآنی
- پیکرهٔ ملی روسی
- پیکرهٔ متنها و گفتارهای اسکاتلندی
- پیکرهٔ ملی اسلوونیایی
- تاکبَنک
- تاتوئیبا
- پیکرهٔ تکزبانهٔ تهران
- تاکستارو د اسپرانتو
- مجموعهپیکرههای دهده
- گنجواژهٔ زبان یونانی
|
|---|
| نهادها و سازمانها |
- کنسرسیوم پیکرهٔ ملی بریتانیا
- پیکرهٔ کوبیلد
- اِسکِچ اِنجین
|
|---|