مبانی جستجودر اینترنت (قسمت دوم و پایانی)
مجله پیام صادق خرداد تا آبان 1381، شماره 41 تا 43
نویسنده : محمد رضا معبودیان اصفهانی
15
در کنار انتخاب موتور جستجوی مناسب با توجه به نوع آن (نمایه ای یا موضوعی یا راهنما) که دارای بانک اطلاعاتی قوی و جامع درباره اطلاعات مورد نیاز باشد، داشتن یک یا چند کلید واژه و یا عبارت جستجوی مناسب برای کاوش در اینترنت الزامی است.
مراحل تهیه عبارت جستجوی مناسب برای کاوش در اینترنت:
مرحله اول: پیدا کردن اصطلاحات تخصصی، رایج و یا متعارف و ... دربارة موضوع مورد نظر. غالباً در هر رشته ای می توان از واژه نامه های تخصصی، عناوین تخصصی و یا سرعنوان های موضوعی و ... استفاده کرد.
مرحله دوم: تبدیل اصطلاحات تهیه شده در مرحله اول به عبارات جستجو. در این مرحله با استفاده از عملگردهای جستجو(Operators) ، بریده سازی (Truncatiion)، اصلاح کننده ها (Modifiers) و ... عبارت های جستجو تهیه و برای کاوش در موتورهای جستجو استفاده خواهد شد.
از آنجا که مرحله اول، تا حدی به میزان تجربه و تخصص و احاطه کاربر بر موضوع مرتبط است، در ادامه فقط به تشریح مرحله دوم (استفاده از عملگردها و بریده سازی و اصلاح کننده ها و ...) خواهیم پرداخت.
عملگردهای جستجو: از عملگرهای جستجو برای ارتباط دادن بین اصطلاحات و کلمات سازندة عبارت جستجو استفاده می شود. این ارتباط می تواند باعث گسترده شدن یا محدود شدن دامنه جستجو شود. (نحوه کار با عملگرهای جستجو با استفاده از جبر بولی میسر می باشد، لذا گاهی به عملگرهای جستجو، عملگرهای بولی نیز گفته می شود).
عملگر AND : هر گاه این عملگر بین دو کلمه یا اصطلاح در عبارت جستجو قرار گیرد، موتور جستجو، اطلاعات یا صفحاتی را بازیابی خواهد کرد که هر دو اصطلاح را شامل شود؛ مثلاً اگر عبارت جستجوی Internet AND Exporer (بدون توجه به ترتیب قرار گرفته کلمات) باشند. هرچه تعداد کلمات کلیدی که با AND به هم مرتبط می شوند، بیشتر باشد، نتایج کمتر، اما دقیق تری به دست خواهد آمد.
عملگر OR : این عملگر باعث بازیابی اطلاعات یا صفحاتی می شود که یک یا هر دو کلمة جستجو را شامل شود؛ مثلاً اگر عبارت جستجوی Internet or Exporer را به کار ببرید، موتور جستجو، تمام صفحاتی را که حاوی یکی از این کلمات یا هر دوی آنهاست، تحویل می دهد. هر چه کلمات کلیدی بیشتری به وسیله عملگر OR ، در عبارت جستجو به کار برده شود، نتایج با دقت کمتر ولی حجم بیشتر ارائه خواهد شد.
عملگر NOT : هر گاه این عملگر بین دو کلمه واقع شود اطلاعات یا صفحاتی بازیابی می شود که کلمه اول را در خود داشته باشد ولی حاوی کلمه دوم نباشد؛ مثلاً اگر عبارت Internet NOT Exporer را به کار ببرید، موتور جستجو، فقط صفحاتی را خواهد یافت که حاوی کلمه Internet و فاقد کلمه Exporer است. (در برخی از موتورهای جستجو به جای NOT باید عبارت ANDNOT را به کار برد.)
علمگر ADJ : این عملگر اطلاعات یا صفحاتی را بازیابی می کند که هر دو کلمه را در کنار هم داشته باشد.
عملگر NEAR : برای جستجوی اطلاعات یا صفحاتی که در آنها دو کلمه در یک جمله به کار رفته باشند از عملگر NEAR استفاده می شود.
نکته مهم: بعضی از موتورهای جستجو، ممکن است از بعضی عملگرهای جستجو پشتیبانی نکنند و یا روش های خاصی برای استفاده از آنها داشته باشند؛ از این رو بهتر است قبل از استفاده از عبارت های دارای عملگر جستجو، به راهنمای (hep) موتور جستجو مراجعه نمایید.
نکته بسیار مهم: همان گونه که پیش تر اشاره شد، استفاده از عملگرهای AND و NOT و ADJ و NEAR باعث محدود شدن دامنه جستجو و بالطبع کم شدن نتایج و در عوض دقت بیشتر جستجو خواهد شد. همچنین استفاده از عمگر OR باعث گسترده شدن دامنه جستجو، زیاد شدن نتایج و دقت پایین خواهد شد. (البته گاهی اوقات لازم است از OR استفاده کنیم؛ مثلاً وقتی هیچ جوابی برای یک جستجو وجود ندارد, می توان با OR محدوده جستجو را بازتر کرد و یا کلمات مترادف را با هم OR کرد.)
استفاده از پرانتز: در مواردی که از چندین عملگر برای جستجو استفاده شده و تقدم و تأخر عملگرها برای جستجو کننده اهمیت داشته باشد، می توان از پرانتز استفاده کرد. در این حالت جملات جستجویی که در داخل پرانتز قرار دارند، بر عبارات دیگر تقدم خواهند داشت.
بریده سازی (truncation) : با استفاده از این روش که معمولاً با درج * در پایان کلمه انجام می شود کلیه مفاهیمی که از لحاظ املایی، ریشه یکسانی دارند، قابل جستجو هستند؛ مثلاً با جستجوی کلمه * comput تمام اطلاعات حاوی computation, computer و ... بازیابی خواهد شد.
Wid card : این کاراکتر ( در اغلب موتورها کارکتر) می تواند جایگزین یک یا چند حرف در کلمة جستجو شده یا جایگزین هیچ حرفی نشود؛ مثلاً جستجوی cdonad؟ ، هر دو کلمه Mcdonad و Macdonad را بازیابی خواهد کرد.
اصلاح کننده ها (Modifiers) : اصلاح کننده (modifier) ، علامتی است که موتور جستجو را وادار می کند با کلمه ای که درست بعد از آن قرار دارد، رفتار خاصی داشته باشد. سه اصلاح کننده رایج در موتورهای جستجو به شرح زیر هستند:
1) +: یعنی کلمه بعد از آن حتماً باید در صفحات وجود داشته باشد؛ مثلاً Iran + tehran + تمام صفحاتی را که دارای کلمات Iran و Tehran (به هر ترتیبی) باشند، بازیابی خواهد کرد.
2) -:یعنی کلمه بعد از آن در هیچ یک از صفحات نباید باشد.
3) :عبارتی که داخل جفت کوتیشن قرار می گیرد، باید دقیقاً با همان شکل و ترتیب در صفحات موجود باشد؛ مثلاً اگر عبارت “Internet Exporer را جستجو کنید فقط صفحاتی در نتایج ظاهر خواهند شد که هر دو کلمه Internet و Exporer با همین ترتیب در آنها وجود داشته باشد.
اسرار جستجوی موفق در اینترنت
1- اکثر جستجوگرها دو نوع محیط جستجو دارند: ساده و پیشرفته. در محیط جستجوی پیشرفته امکانات بیشتری وجود دارد که می توان با محدودتر کردن دامنه جستجو، ارتباط نتایج با موضوع جستجو را بیشتر کرد.
2- سرعت به هنگام شدن (به روز رسانی) اطلاعات یک Search Engine در کاوش و نتایج آن بسیار موثر است.
3- در عبارت های جستجو از s و es (و این گونه حروف گرامری ) استفاده نکنید.
4- در عبارت جستجو، حرف اول اصطلاحات را بزرگ بنویسید؛ مثل Internet یا Exporer
5- برای جستجوی نام یک شخص از «و» استفاده نکنید، زیرا اغلب موتورهای جستجو «و» را نادیده می گیرند؛ مثلاً از عبارت Ai Hossiniجای Ai,Hossiniاستفاده شود.
6- در بانک های اطلاعاتی که با موتورهای جستجو در آن کاوش می شود, غالباً اطلاعات کلی، به صورت زیر دسته بندی می شود:
آدرس سایت، نام سایت، توضیح مختصر دربارة محتویات و فعالیت آن سایت و مجموعه ای از اطلاعات کلیدی که مرتبط با محتویات سایت است؛ بنابراین اگر کلیدواژه یا عبارت جستجوی شما، با یکی از این اطلاعات مطابقت داشته باشد آدرس آن صفحات یا سایت به همراه توضیح مختصر درخصوص محتویات و فعالیت آن سایت در موتور جستجو تهیه و به لیست موارد بازیابی شده اضافه می شود. (به این لیست hit ist گفته می شود) دانستن دسته بندی های اطلاعات در بانک های اطلاعاتی، واژه گزینی در موتورهای جستجو را تسهیل می کند.
7-در روند کاوش در اینترنت، به هدف نخوردن جستجو یا گل نشدن آن به دو صورت است:
الف- هیچ اطلاعات یا صفحه ای پیدا نشود.
ب- بیشتر از 20 تا 100 صفحه پیدا شود.(ازدیاد صفحات، باعث سردرگمی کاربر خواهد شد.)
درصورتی که بیش از 20 تا 100 صفحه یا سایت در hit ist ظاهرشد توصیه می شود چند صفحه اول با توجه به توضیحات آن صفحات بازبینی شود. اگر آن چند صفحه با موضوع مورد نظر مرتبط نبودند، جستجو را دوباره با استفاده از عملگرها و اصلاح کننده ها و ... ادامه دهید.
اغلب با استفاده از عملگرها و اصلاح کننده ها (و دیگر تکنیک ها و ابزارها) می توان از کلید واژه نامناسب برای کاوش، یک عبارت جستجوی مناسب تهیه کرد.
8-اگر به املای کلمات در عبارت جستجو مشکوک هستید، می توانید از بریده سازی (استفاده از * ) و یا Widcard استفاده کنید.
9-در کنار موتورهای جستجوی اطلاعات, موتورهای جستجوی دیگری نیز در اینترنت وجود دارند؛ مثلاً موتورهای جستجوی اشخاص و موتورهای جستجوی برنامه های رایانه ای, موتورهای جستجوی موسیقی و فیلم و ...
10- برای استفاده از عملگرهای جستجو، حتماً AND ، OR ، NOT و ... را با حروف بزرگ بنویسید.
معرفی موتورهای جستجوAtavista
آدرس موتور جستجو WWW.atavista.com
آشنایی:
این سایت (پایگاه) یکی از بزرگترین و جامع ترین جستجوگرهای اینترنت است که اطلاعات بیش از 250 میلیون صفحه Web را در بانک اطلاعاتی خود جا داده است. اطلاعات این بانک اطلاعاتی دائماً به روزرسانی می شود و برای این به روزرسانی تمام صفحات htm در آن به صورت «تمام متن» یا Futext نمایه می شود. در عین حال بزرگترین عیب این موتور ارائه نتایج بسیار به علت کثرت منابع می باشد.
امکانات:
جستجو در 25 زبان
جستجوی موضوعی (در گروه های هنر و سرگرمی Arts Entertainment ، اتومبیل «Autos » ، تجارت و امور مالی «Business Finance » ، کامپیوتر «Computer» ، بهداشت و پزشکی «Heath Fitness» ، خانه داری و امور منزل «Home Famiy» ، اینترنت «Internet» ، اخبار و رسانه ها «News Media» ، سیر و سیاحت «Recreation Trave» ، مراجع «Reference» ، مناطق و کشورها «Regiona» ، علوم «Science» ، فروشگاه ها و خرید «Shopping»، فرهنگ و جامعه «Society Cuture» ، ورزش «Sports» و جهان «Word») لازم است ذکر شود که این دسته بندی ها در اکثر موتورهای جستجوی عمومی رعایت می شود.
حساسیت به حالت یا heo,HEO,Heo)Case-Sensitive هر سه معادل هستند)
ترجمه رایانه ای بین زبان های انگلیسی، فرانسه، ایتالیایی، پرتقالی، آلمانی، اسپانیایی
کنترل بر نحوة نمایش نتایج
امکان نوشتن جمله سؤالی در قسمت جستجو
امکان جستجو در صفحات وب، اخبار، گروه های مباحثه، محصولات، تصاویر، فیلم و قطعات موسیقی
مرتبه بندی نتایج جستجو
کمبودها:
عدم امکان جستجوی مجدد از میان نتایج
عدم اعلام درصد مطابقت عناوین پیدا شده با موضوع جستجو
منطق:
عملگر OR به صورت پیش فرض میان کلیدواژه ها قرار دارد.
امکان استفاده از عملگرهای NEAR,ANDNOT, AND نیز در حالت جستجوی پیشرفته (Advance) وجود دارد.
بریدن کلمات خودکار نیست.
استفاده از حروف بزرگ به معنای جستجوی دقیق برای تطابق کامل است. اما در صورت استفاده ازحروف کوچک، هر دو حالت بزرگ و کوچک جستجو می شوند.
امکان استفاده از anchor در عبارت جستجو؛ با این فرمان صفحاتی یافت می شود که عبارت مورد نظر در آنها به صورت Hyper ink است.
مثال:anchor: Downoad IE5
امکان استفاده از domain در عبارت جستجو؛ با این فرمان سایت هایی یافت می شود که domain آنها نوع مورد نظر باشد.
Domain یا قلمرو نشان دهنده نوع سایت و یا کشوری آن است مثل ir برای iran و uk برای انگلستان و ... ضمناً رایج ترین قلمروهای غیر کشوری عبارتند از Edu برای سایت های آموزشی / دانشگاهی ، Com برای شرکت ها و مؤسسات تجاری، org برای سازمان ها و gov برای سایت های دولتی
مثال domain : edu
امکان استفاده: از host در عبارت جستجو؛ با این فرمان صفحات یک رایانة خاص پیدا می شوند. مثال : host:www.isu.ac.ir
امکان استفاده از: image در عبارت جستجو؛ این فرمان ازکاوشگر می خواهد صفحاتی را پیدا کند که دارای فایل تصویر مشخصی باشند:
مثال image; start
امکان استفاده از:ink در عبارت جستجو؛ این فرمان که باید در جلوی آن نام یک سایت (UR) را وارد کرد، صفحاتی را پیدا می کند که با سایت به خصوصی پیوند دارند. مثال ink:www.zip2.com
امکان استفاده از : text در عبارت جستجو: صفحاتی را پیدا می کند که شامل عبارت مورد نظر در هر قسمت صفحه باشد. مثال text:study
امکان استفاده از: tite در عبارت جستجو؛ صفحاتی را پیدا می کند که شامل عبارت مورد نظر در «عنوان» صفحه هستند. این عناوین در قسمت عنوان بیشتر مرور گرها ظاهر می شود. مثال tite: sunset
امکان استفاده از : UR در عبارت جستجو؛ با این زمان صفحاتی پیدا می شوند که عبارت یا کلمه مورد نظر در نشانی آنها وجود دارد.
مثال UR:isu
نتایج جستجو: این جستجوگر شامل عنوان، نشانی UR، دو خط اول توضیحات سایت، تاریخ آخرین به روزرسانی، حجم ( بر حسب بایت) و زبان اطلاعات است.
Excite
آدرس موتور جستجو:www.excite.ocm
آشنایی
بهترین مورد استفاده از این سایت،یافتن موضوعات روز و مسائلی است که در سطح وسیعی از آنها صحبت می شود. این جستجوگر درمیان 205 میلیون صفحه و ابزارهای رسانه ای و نیز اخبار usenet به جستجو می پردازد. این سایت همچنین مجموعه ای جامع و عمیق از موضوعات را از 150 هزار منبع در اختیار دارد. سایت Excite در زمینه جستجوی مفهومی بی نظیر است، زیرا این موتور با استفاده ترکیبی ازنمایه ها و موضوعات می تواند لغات کلیدی و موضوعات مختلف را برای شما جستجو کند. ضمناً Exite با استفاده از ارجاعات متون مرتبط به موضوع را هم می یابد.
امکانات
جستجو در 11 زبان مختلف
جستجو در میان فهرستی از کشورها یا Domain ها (مثلorg,com . و ...)
جستجوی مجدد از میان نتایج
ارائه درصد مطابقت عنوان پیدا شده با عبارت جستجو
کمبودها
حساسیت نداشتن به حروف بزرگ و کوچک
امکان نوشتن جمله سؤالی در قسمت جستجو نیست
مرتبه بندی نبودن نتایج جستجو
نبود کنترل بر نحوه نمایش نتایج
منطق
عملگر OR به صورت پیش فرض میان کلید واژه ها قراردارد.
امکان استفاده از عملگرها ANDNOT,AND نیز وجود دارد.
در صورت وجود حروف بزرگ در ابتدای کلمات، Excite آنها را به عنوان نام شناسایی می کند.
کلمات به صورت خودکار به عنوان پیشوند یا ریشه، در نظر گرفته می شوند.
اصلاح کننده ها قابل استفاده هستند.
نتایج جستجو: شامل عنوان, نشانی UR , خلاصه ای ازمطالب و درصد ارتباط (مطابقت) با موضوع جستجو است.
Googe
آدرس موتور جستجو www.googe.com
آشنایی:
این موتور از بزرگترین موتورهای جستجو وب در جهان است و گذشته از چندین سرمایه گذار خصوصی، دانشگاه استنفورد، شرکت SUN و شرکت های دیگری جزء سهامدارن آن هستند. Googe با ادغام سخت افزارها و نرم افزارهای پیشرفته، همراه با الگوریتمی منحصر به فرد، قدرت پاسخگویی به سؤالات گوناگون کاربران را دارد. قلب نرم افزار آن rank Page نام دارد که در واقع فهرستی برای طبقه بندی صفحات وب است. نحوة کار page rank بدین صورت است که از ساختار بندی پیوند وسیع ( vast ink) که در واقع ماهیت بسیار جالب و بی همتای وب است، به عنوان شاخصی از تعداد صفحات خصوصی استفاده می کند، مثلاً Googe یک پیوند از صفحه A به صفحه B را همانند یک رأی از جانب A به B در نظر می گیرد و در نهایت به تعداد خالص این رأی ها یا همان پیوندهایی که از صفحه دریافت شده است، نگاه می اندازد. سپس صفحاتی را که بیشترین تعداد رأی از آنها صادر شده است، تحلیل می کند.
بدین ترتیب پایگاه های مهم اطلاعاتی، در هنگام طبقه بندی در نقطة بالاتری قرار می گیرند. همچنین Googe تعداد ارجاعات کاربران به صفحات فوق به خاطر می سپارد و هر چه این ارجاعات بیشتر باشد، در دفعات بعدی، صفحات مورد نظر در نقطة بالاتری در طبقه بندی قرار می گیرند. در نهایت برای آنکه اطلاعات مورد نظر جستجو و بازیابی شود، Googe از تکنیک «شمارش تعدد دفعاتی که عبارت مورد نظر در یک صفحه دیده شده است» استفاده می کند.
امکانات:
جستجو به 50 زبان مختلف (جستجو در زبان عربی نیز امکان پذیر است؛ برای این کار در گزینه gooe in your anguage زبان مورد نظر را انتخاب کنید.
جستجوی عناوین ویژه (topic specific search)
جستجوی موضوعی
حساسیت به حالت یا case sensitive
منطق:
عملگر AND به صورت پیش فرض میان کلید واژه ها قرار دارد.
امکان استفاده از OR و NOT میسر است.
امکان استفاده از اصلاح کننده ها و بریده سازی وجود دارد.
نتایج جستجو: این جستجوگر شامل عنوان نشانی UR , توضیحات و حجم (بر حسب بایت) است.
آدرس موتور جستجو www.Yahoo.com
آشنایی:
Yahoo بهترین موتور جستجوی موضوعی به شیوة سلسله مراتبی یا درختی است. Yahoo ،پانصد هزار سایت, صفحه یا مدرک موجود در اینترنت را در یک ساختار سلسله مراتبی موضوعی و جامع (تقریباً 25 هزار دسته) آماده بازیابی کرده است. نتایج جستجو در Yahoo به صورت تقسیمات موضوعی – از موضوعات کلی تر به موضوعات جزئی تر – ارائه می شود. مزیت این شیوه، بازیابی در آن است که جستجوگر با مقوله های موضوعی اعم و نیز اخص نسبت به موضوع مورد نظر آشنا می شود وحتی می تواند با انتخاب آنها، سایت ها و صفحات دیگری را بازیابی کند. Yahoo برای تسهیل بازیابی، امکان جستجوی کلیدواژه ای از موضوعات را نیز در اختیار می گذارد. ضمناً همراه با بازیابی سایت ها وصفحه ها، توصیفی کوتاه از آنها نیز ارائه می شود.
در عین حال، اشکالاتی به شرح زیر در Yahoo وجود دارد.
الف- در بسیاری از موارد، تغییر نشانی سایت ها از سوی پدیدآورندگان آنها در Yahoo اصلاح نشده (به روز نمی شود) و این امر موجب سردرگمی و اتلاف وقت کاربران می شود.
ب- حدس زدن اینکه مدارک یا سایت های مورد نظر کاربر، جزء کدام دسته یامقوله موضوعی است برای کاربر دشوار است. علاوه بر آن، برخی موضوعات در گروه یا دسته کاملاً مربوط ومناسبی قرار نگرفته است و این باعث سردرگمی بیشتر کاربر می شود. جستجوی کلیدواژه ای در Yahoo که برای کمک به کاربر در یافتن حوزه موضوعی مورد نظر استفاده می شود، در بیشتر موارد نتایج بسیار و بعضاً نامربوط را ارائه می کند. این سایت بزرگترین پرتال افقی در اینترنت است.
امکانات:
جستجوی موضوعی (جستجوی سلسله مراتبی دارد.)
نمایش نتایج در قالبها, دسته بندی ها و گروه های سایت های اینترنتی و صفحات امکان پذیر است.
امکان جستجوی کلیدواژه ای در میان عناوین، گروه های خبری و آدرس های پست الکترونیک وجود دارد.
کمبودها:
جستجوی حساس به حالت یا Case-sensitive ندارد.
درصدد مطابقت هر عنوان باعبارت جستجو نمایش داده نمی شود.
نبود کنترل بر نمایش نتایج
عدم جستجوی مجدد از میان نتایج
حساسیت به حروف بزرگ و کوچک در این موتور منظور نشده است.
امکان نوشتن جمله سؤال در قسمت جستجو وجود ندارد.
منطق
عملگر AND به صورت پیش فرض میان کلید واژه ها قرار دارد.
امکان استفاده از عملگرهای OR و NOT موجود است.
امکان استفاده از t: برای محدود کردن نتایج به عناوین (tite) مثلاً : t:Internet
امکان استفاده از u: برای محدود کردن نتایج به آدرس ها (ur) مثلاً: u:Internet
امکان استفاده از اصلاح کننده ها وجود دارد.
نتایج جستجو : در این موتور جستجو شامل عنوان، خلاصه، توضیحات سایت یا صفحه پیدا شده و آدرس سایت (ur) است.
نظر شما