لیست مقالات

لطفاً در صورت استفاده از مجموعه‌های همشهری و یا ابزارهای جانبی توسعه داده شده از [1] جهت ارجاع استفاده نمایید.

 

[1] Abolfazl AleAhmad , Hadi Amiri , Ehsan Darrudi , Masoud Rahgozar , Farhad Oroumchian, Hamshahri: A standard Persian text collection, Journal of Knowledge-Based Systems, Vol. 22 No.5, p.382-387, Elsevier, July 2009.
دانلود
توضیح
توضیح کامل مجموعه آزمایش همشهری نسخه 1

 

[2] Ehsan Darrudi, Mohammad Reza Hejazi, Farhad Oroumchian, Assessment of a Modern Farsi Corpus, In Proceedings of the 2nd Workshop on Information Technology & its Disciplines (WITID'04), ITRC, Kish Island, Iran, 2004.
دانلود
توضیح
روش ساخت و اطلاعات آماری مجموعه متنی را توضیح می‌دهد. همچنین بعضی پارامتر‌های زبان فارسی مانند تبعیت با قانون Zipf و میزان آنتروپی آن نیز محاسبه شده‌اند.

 

[3] Hadi Amiri, Abolfazl AleAhmad, Farhad Oroumchian, Caro Lucas, Masoud Rahgozar, Using OWA Fuzzy Operator to Merge Retrieval System Results, The Second Workshop on Computational Approaches to Arabic Script-based Languages, LSA 2007 Linguistic Institute, Stanford University, USA, 2007.
دانلود
توضیح
مقاله زیر ٦ روش بازیابی اطلاعات را با استفاده از مجموعه متنی همشهری ارزیابی می‌کند. همچنین روشی برای ترکیب این روش‌ها جهت افزایش کیفیت جواب‌های سامانه ذکر شده است. روش‌های پیاده‌سازی شده در این مقاله عبارتند از Vector Space (دو روش) و Language Modeling (چهار روش). کد منبع این پیاده‌سازی‌ها نیز قابل دریافت است: جهت دریافت کد منبع پیاده‌سازی Vector Space اینجا و جهت دریافت کد منبع پیاده‌سازی Language Modeling اینجا را کلیک کنید.

 

[4] Abolfazl Aleahmad, Parsia Hakimian, Farzad Mahdikhani, Farhad Oroumchian, N-Gram and Local Context Analysis For Persian Text Retrieval, International Sympo-sium on Signal Processing and Its Applications, Sharjah U.A.E., 2007.
دانلود
توضیح
در این مقاله مدل بازیابی N-gram Vector Space با دو روش وزن‌دهی (atc.atc و Lnu.ltu) بررسی و با روش LCA بهبود داده شده است. در Lnu.ltu از دو نوع نرمال‌سازی Pivoted Cosine و Pivoted Unique با شیب 0.25 و 0.75 استفاده شده و نشان داده شده که 4-gram Lnu.ltu با شیب 0.25 کارایی مناسبی دارد و LCA بهترین کارایی را دارد.

 

[5] Alireza Mokhtaripour, Saber Jahanpour, Introduction to a new Farsi stemmer, Proceedings of the 15th ACM international conference on Information and Knowledge Management, p. 826 - 827, ISBN:1-59593-433-2, 2006.
دانلود
توضیح
استفاده از مجموعه همشهری در ساخت یک ریشه‌یاب فارسی

 

[6] Farhad Oroumchian, Ehsan Darrudi, Fattane Taghiyareh, Neeyaz Angoshtari, Experiments with Persian text compression for web, 13th International World Wide Web conference, New York, NY, USA, 2004.
دانلود
توضیح
ابداع یک روش فشرده‌سازی بدون نیاز به مرحله باز نمودن (Decompression) بر اساس داده‌های مجموعه همشهری

 

[7] Abolfazl AleAhmad, Ehsan Kamalloo, Arash Zareh, Masoud Rahgozar, Farhad Oroumchian, Cross Language Experiments at Persian@CLEF 2008, in Woking Notes of Cross Language Evaluation Forum (CLEF 2008), Aarhus, Denmark, 2008.
دانلود
توضیح
استفاده از مجموعه همشهری در آزمایش سامانه بازیابی متون فارسی در همایش CLEF سال 2008

 

[8] Amir Nayyeri, Farhad Oroumchian, FuFaIR: a Fuzzy Persian Information Retrieval System, IEEE International Conference on Computer Systems and Applications, p. 1126-1130, 2006.
دانلود
توضیح
این مقاله طراحی، پیاده‌سازی و تست یک سیستم بازیابی اطلاعات فازی برای زبان فارسی را ارائه می‌دهد

 

[9] بهاره بینا ،مسعود رهگذر، آذین ده موبد، طبقه بندی خودکار متون فارسی، سیزدهمین کنفرانس ملی انجمن کامپیوتر ایران، جزیره کیش، خلیج فارس، ایران، اسفند 1386.
دانلود
توضیح
استفاده از مجموعه همشهری جهت طبقه بندی استاد فارسی

 

[10] Morteza Mohaqeqi, Reza Soltanpoor, Azadeh Shakery, Improving the Classification of Unknown Documents by Concept Graph, CSICC2009, Tehran, Iran, 2009.
دانلود
توضیح
ارزیابی الگوریتم‌های کلاس‌بندی و خوشه‌بندی برای زبان فارسی

 

 


  • » مجموعه همشهری
  • » دانلود
  • » لیست مقالات
  • » اعضای پروژه
  • » تماس با ما

پیوندها
  • پیکره بیژن‌خان «
  • dotIR مجموعه وب «
  • دانشگاه تهران «
  • DBRG «
  • TREC «
  • CAASL «
  • CLEF «

 

© Copyright 2009 University of Tehran, Database Research Group. All Rights Reserved.
Designed by Farzad Mahdikhani - Last update: 2010 Feb. 18