اخبار دانشگاه

آشنایی بیشتر با موتور جستجوگر مدیارم (طراحی شده توسط دانشجوی مبتکر دانشگاه سیستان وبلوچستان )

  • شنبه, ۲۱ اسفند ۱۳۹۵

(طراحی شده توسط دانشجوی مبتکر دانشگاه سیستان وبلوچستان )

واحد فناور "بفردا" مستقر در مرکز رشد واحد های فناور دانشگاه سیستان و بلوچستان موفق به طراحی موتور جستجوی مدیارم شد.

این موتور جستجو توسط سامان رفیعی طراحی و توسعه داده شده و حول محور کامپیوتر و برنامه نویسی است. موتور جستجوی مدیارم در رویداد کارآفرینی محتوا و خدمات جویشگر بومی (دانشگاه شهید بهشتی تهران-بهمن 95) به عنوان تنها نماینده جنوب کشور ارائه گردید و موفق به کسب مقام پنجم از میان 60 تیم شد. مطالب زیر اطلاعات تکمیلی است جهت آگاهی بیشتراز نحوه کار این موتور جستجوگر که توسط این دانشجوی خلاق ارايه شده است.



مدیارم چیست؟ چه کاربردی دارد؟ و چگونه کار می کند؟

مدیارم یک موتور جستجوی متمرکز در حوزه کامپیوتر است و در دسته بندی موتور های جستجو میتوان عملکرد آنرا به عنوان یک موتور جستجوی پیمایشی (خودکار) همانند گوگل شناخت.اما مدیارم قرار نیست جایگزینی برای سایر جستجوگر ها باشد زیرا جستجوگرهای مانند گوگل یک موتور جستجوی عمومی هستند و مدیارم یک موتور جستجوی متمرکز است و سعی بر این دارد که تمام تمرکز خود را روی موضوع کامپیوتر داشته باشد و با امکاناتی خاص که موتورهای جستجوی بزرگی مانند google, bing, yahoo , و روی آنها تمرکز نمی کنند، معرفی گردد.

طراح مدیارم می گوید، عملکرد مدیارم از آنجا شروع می شود که فقط سایت هایی را ایندکس می کند که در حوزه کامپیوتر باشند. ما این کار را به وسیله الگوریتمی انجام میدهیم که وظیفه دارد در تاریخ های مشخص شده به سایت ها سر بزند و داده های آنها را جمع آوری کند. در دومین گام نیازمند الگوریتمی هستیم که داده های جمع آوری شده را ایندکس کند و برای هر صفحه یا هر سایت ارزشی را تعریف کند و در نهایت نیازمند الگوریتمی هستیم که براساس داده های ذخیره شده پاسخگوی درخواست های کاربران باشد. این خلاصه ای از عملکرد پایه ی مدیارم است که بدون در نظر گرفتن چگونگی طراحی، چنین الگوریتم هایی را می توان تعریف کرد.

در سطح پیشرفته مدیارم در قالب یک جویشگر بومی نیست چون علم کامپیوتر بر پایه زبان انگلیسی است و مدیارم با تمرکز بر آن می تواند در سطح جهانی باشد همچنین بخش هایی از مدیارم قابلیت بومی سازی را بصورت چند زبانه دارد. از طرفی چون حجم سایت هایی که مدیارم ایندکس می کند بسیار کمتر از یک جویشگر عمومی است هزینه ی کمتری برای عملیاتی کردن لازم دارد.

مدیارم در سطح پیشرفته شامل امکاناتی برای برنامه نویسان است که سرعت دریافت پاسخ مورد نظر برای برخی از امکانات حتی از گوگل هم سریعتر است. این دسته از امکانات می توانند در آینده بیشتر و دقیق تر هم بشوند.

اما از بعد فنی که چطور داده های یک سایت را میتوان جمع آوری کرد و چگونه میتوان تشخیص داد که یک صفحه وب درباره چه موضوعی است بسیار پیچیده است. فرض کنیم از چنین مرحله ای گذشتیم، باز هم مشکل بزرگ دیگری که داریم این است که برای سیستمی که در لحظه داده تولید می کند و حجم آن داده ها در روزها یا ماه ها یا سالها پس از فعالیت در حد big data است (و فقط در حد تصور یک متخصص دیتابیس است که بفهمد جستجو در دیتابیسی با میلیارد ها رکورد چقدر زمانبر است) حال برای آن سیستمی که هر لحظه باید پاسخگوی چندین کاربر بصورت همزمان هم باشد ما را ملزم به استفاده از چند سرور برای توزیع شدگی دیتابیس می کند و تهیه سرور هزینه در بر دارد.

 از دیگر مواردی که باید گفت: توجه به اینکه الگوریتمی که یک موتور جستجو بر پایه آن کار می کند برای آن شرکت بسیار اهمیت دارد، از طرفی  هیچ اثری یافت نمی شود که راه حل یا روشی که یک جستجوگر بزرگ استفاده کرده است را بتوان فهمید، مگر در حد اشاره کوچک. مثلا گوگل می گوید مرغ مگسخوار (یکی از الگوریتم های گوگل) به عنوان صفحه ها اهمیت زیادی می دهد اما چگونگی آن را بیان نمی کند.





رفیعی گفت، من هم از حدود دو سال پیش مشغول به نوشتن یک موتور جستجو صرفا برای تفریح و افزایش قدرت برنامه نویسی خود شدم. مشکلاتی که در هر گام پیش می آمد را بررسی کردم و راجع به آنها تحقیق کردم. نحوه ذخیره سازی و ایندکس گذاری آنقدر پیچیده بود که بعد از یک سال برای سومین بار مجبور به طراحی مجدد با ورژنی جدید شدم. اکنون همه آن مشکلات و الگوریتم ها نوشته شده است و به مرحله عملیاتی شدن رسیده است و تنها مشکلی که مدیارم برای عملیاتی شدن دارد حجم داده بالا است که نیازمند سرمایه گذاری برای تهیه سرور است.

وی در خاتمه گفت، جا دارد از مهندس رحمانی رئیس مرکز فناوری اطلاعات دانشگاه به خاطر همکاری و اجازه دسترسی به سرور های دانشگاه تشکر و قدر دانی نمایم.

گفتنی است مدیارم می تواند به واسطه امکاناتی که در اختیار کاربران قرار می دهد از محل ارایه هزینه های تبلیغات درآمد زا باشد. همچنین در آینده می تواند همه تولید کنندگان محتوا در زمینه کامپیوتر را در بر داشته باشه که این خود بازار بزرگی برای کسب درآمد مدیارم و یا حتی شرکت های دیگر است.

آرشیو خبرنامه ها

عضویت در خبرنامه
پست الکترونیک