Elmdən başlayın. İnformasiya axtarışının müasir üsulları
İnformasiya axtarışı üçün informasiya texnologiyaları
İnformasiya axtarışı: əsas anlayışlar, təşkilatın növləri və formaları
İnformasiya axtarışı və ya məlumat axtarışı əsas informasiya proseslərindən birini təmsil edir. Bəşəriyyət qədim zamanlardan bununla məşğul olmuşdur. Axtarışın məqsədləri, imkanları və xarakteri həmişə informasiyanın mövcudluğundan, onun əhəmiyyətindən və əlçatanlığından, habelə axtarışın təşkili vasitələrindən asılı olmuşdur.
20-ci əsrin sonu - 21-ci əsrin əvvəlləri cəmiyyətin ən geniş təbəqələri üçün əlçatan və maraq doğuran çoxlu sayda daim artan müxtəlif məlumatlarla xarakterizə olunur. Üstəlik, əksər insanlar üçün də mövcud olan İnternet texnologiyaları və proqram və avadanlıq vasitələri bu prosesi istənilən vaxt, demək olar ki, hər yerdə, istənilən sorğu üçün həyata keçirməyə imkan verir.
Axtar– bu və ya digər ardıcıllıqla axtarılan obyektin massivdə saxlanılan hər bir obyektlə korrelyasiya olunduğu proses. İstənilən axtarışın məqsədi axtarış edən şəxsə lazım olan məlumatı, biliyi və s. öz peşəkar, mədəni və hər hansı digər səviyyənizi təkmilləşdirmək; yeni məlumat yaratmaq və yeni biliklər yaratmaq; idarəetmə qərarlarının qəbulu və s.
Ekspertlərin fikrincə, internetdə milyardlarla istifadəçi var. Bunlardan yüz milyonları onlayndır (İngiliscə “on-line” - istənilən vaxt interaktiv giriş) və belə istifadəçilərin sayı durmadan artır. Bu, sürətli axtarışı təşkil etməyi və bir çox istifadəçi üçün lazım olan məlumatı tapmağı çətinləşdirir. İnformasiya axtarışının müxtəlif imkanları (növləri), onların informasiya axtarış sistemlərində (IRS) həyata keçirilməsinin müxtəlif üsulları ilə əlaqədar problemlər yaranır. müxtəlif səviyyələrdə bu cür sistemlərin imkanları haqqında istifadəçi bilikləri, xüsusən sorğuların yaradılması və bu sorğuların icrası nəticəsində əldə edilən məlumatların emalı sahəsində və s.
Gələcəkdə konkret istifadəçilərin bilik səviyyəsinə və sorğularına avtomatik uyğunlaşa bilən, sorğuları təbii dildə qəbul edən və süni intellektdən istifadə etməklə onları müvafiq və lazımi informasiya ilə təmin edə bilən informasiya sistemlərinin yaradılması gözlənilir. Belə informasiya sistemlərinin yaradılması üçün informasiya sistemlərinin konkret istifadəçilərinin və ya onların vasitəçilərinin intellekt və biliyi tələb olunacaq. Bu arada, geniş axtarış sistemi istifadəçilərinin bu mövzu sahəsini kifayət qədər yaxşı bilməsi tələb olunur.
“İnformasiya axtarışı” və ya “informasiya axtarışı” termininin müxtəlif şərhləri var.
termini "məlumat axtarışı"(İngiliscə: "information retrieval") amerikalı riyaziyyatçı K. Mooers tərəfindən təqdim edilmişdir. O qeyd etdi ki, belə bir axtarışın motivasiyaedici səbəbi məlumat ehtiyacı , informasiya sorğusu şəklində ifadə edilir. K.Muers informasiya axtarışı obyektləri kimi sənədləri, onların mövcudluğu və (və ya) yerləşdiyi yer haqqında məlumatları, faktiki məlumatları daxil etmişdir.
Kitabxanaların nümayəndələri faktiki axtarış problemlərini ilk dəfə həll etdilər. "adlı məlumat axtarış vasitələrini inkişaf etdirdilər. istinad axtarış motoru " (kataloqlar, biblioqrafik göstəricilər və s.). Peşəkar yerli mətbuatda bu termin 1970-ci illərdən istifadə olunur. Kitabxanaçılar " məlumat axtarışı "məlumatda olmaq kimisənədlər toplusu , uyğunduristifadəçi məlumat sorğusu .
Kompüter texnologiyasından istifadə baxımından”məlumat axtarışı - istehlakçının tələbinə uyğun sənədləri, onlar haqqında məlumatları, faktları, məlumatları tapmaq məqsədi ilə məntiqi və texniki əməliyyatlar məcmusudur.
" Uyğunluq" - nə vaxt təyin edinməlumat axtarışı sənəd məzmununun uyğunluğuinformasiya tələbi və ya axtarış reseptinə sənədin axtarış şəkli.
Başqa təriflər də var. İstənilən halda informasiya axtarışı axtarış sistemlərinin köməyi ilə onlara lazım olan məlumat və ya məlumatı tez bir zamanda əldə etməyi gözləyən istifadəçilərin informasiya sorğularının ödənilməsi ehtiyacından yaranır. Bu, müxtəlif məlumat mənbələrindən, məsələn, məlumat banklarından və ya saxlama cihazlarından müvafiq sənədlərin və (və ya) faktların məqsədyönlü axtarışı və çıxarılması üsuludur. Bunlar müxtəlif mənbələri və informasiya vasitələrini təmsil edən canlı və cansız obyektlərdir.
Belə informasiya axtarışının həyata keçirilməsini təmin edən sistemlər adlanırAxtarış motorları(PS). Ənənəvi texnologiyalarda PS-lər kartotekalar və kataloqlar, ünvan və digər kataloqlar, indekslər, ensiklopediyalar, nəşrlər üçün istinad aparatları və digər materiallardır.
1945-ci ildə amerikalı alim və mühəndis U.Buş “Təfəkkürümüzün mümkün mexanizmi” adlı məqaləsində ilk dəfə olaraq informasiya axtarışının mexanikləşdirilməsinin zəruriliyi məsələsini geniş şəkildə qaldırdı.
1960-cı illərdən informasiya ilə işləyən avtomatlaşdırılmış axtarış sistemləri meydana çıxdı. Bu dövrdən informasiya axtarışının prinsip və üsullarının formalaşdırılması və həyata keçirilməsi sahəsində intensiv iş aparılır.
" Axtarış motorları"verilənlər bazası sənədləri və ya müəyyən sözləri ehtiva edən maşın tərəfindən oxuna bilən məlumatların digər massivləri arasında axtarış.
Adi və ya ağıllı terminallardan (PC) istifadə edən elektron PS istifadəçilərə məzmunu təsvir edən formal elementlərdən və xüsusi məntiqi operatorlardan istifadə etməklə axtarış sorğuları aparmağa imkan verir; verilənlər bazası sənədləri və ya müəyyən sözləri ehtiva edən maşın tərəfindən oxuna bilən məlumatların digər massivləri arasında axtarış aparın. Axtarış motorları yalnız axtarış prosedurlarına və əlaqəli proseslərə icazə verir.
İnformasiya axtarış sistemləri
Geniş funksiya və imkanlara malik proqram sistemləri adətən DBMS-ə daxil edilir və informasiya axtarış sistemləri adlanır. Onlar həmçinin istifadəçilərə lazım olan məlumatları, o cümlədən İnternetdə səmərəli şəkildə tapmaqda kömək etmək üçün yaradılır və istifadə olunur.
Terminoloji olaraq "məlumat axtarış sistemi"(İngiliscə: "information retrieval system", IRS) - informasiyanın axtarışı və saxlanması üçün nəzərdə tutulmuş sistemi təmsil edir; informasiya bazalarında və məlumat banklarında yaradılması, yenilənməsi, saxlanması və axtarışı proseslərini həyata keçirən proqram paketi.
Məlumat axtarış sistemi həm də informasiya axtarışı dili və müvafiq axtarış qaydaları əsasında zəruri məlumatların axtarışını və seçilməsini təmin edən sistem kimi şərh olunur və verilənlər bazası– böyük informasiya massivlərinin toplanması, yığılması və işlənməsini asanlaşdıran məlumatların təsviri, saxlanması və manipulyasiyası üçün alətlər və metodlar toplusu kimi. Müxtəlif verilənlər bazalarının təşkili məlumat obyektlərinin tipinə və onlar arasındakı əlaqələrə görə fərqlənir.
Müasir informasiya sistemlərinin işləməsi iki fərziyyəyə əsaslanır:
istifadəçi tərəfindən tələb olunan sənədlər müəyyən xüsusiyyətin və ya xüsusiyyətlərin birləşməsinin olması ilə birləşir;
istifadəçi bu atributu təyin edə bilər.
Bu fərziyyələrin hər ikisi praktikada yerinə yetirilmir və biz yalnız onların yerinə yetirilməsi ehtimalından danışmaq olar. Buna görə də, informasiyanın axtarışı prosesi adətən sistem vasitəsilə müəyyən nəticəyə gətirib çıxaran və onun tamlığını qiymətləndirməyə imkan verən addımlar ardıcıllığını ifadə edir. Eyni zamanda, axtarış prosesinin idarə edilməsinin təşkiledici başlanğıcı kimi istifadəçi davranışı təkcə məlumat ehtiyacı ilə deyil, həm də sistem tərəfindən təqdim olunan müxtəlif strategiyalar, texnologiyalar və alətlər ilə motivasiya olunur.
İstifadəçi adətən axtarış apardığı resursun informasiya məzmunu haqqında hərtərəfli biliyə malik olmur. O, sorğu ifadəsinin adekvatlığını, eləcə də əldə edilmiş nəticənin tamlığını əlavə məlumat tapmaqla və ya prosesi elə təşkil etməklə qiymətləndirə bilər ki, axtarış nəticələrinin bir hissəsi sorğunun adekvatlığını təsdiq və ya inkar etmək üçün istifadə olunsun. başqa bir hissə. Eyni zamanda, peşəkar istifadəçilər sabit tematik profil ilə xarakterizə olunur. Onlar “informasiya yönümlü” olduqda, problemin informasiya məkanını təşkil etmək istəyi və bacarığı ilə xarakterizə olunurlar. Bu o deməkdir ki, istifadəçi mahiyyətcə yeni, "müstəqil" problem yönümlü, fərdi yenilənmiş və doldurulmuş İR yaradır ki, bu da sənədlər toplusundan əlavə, metainformasiyanı, məsələn, xüsusi terminologiya lüğətlərini, mövzu sahələrinin təsnifatını da ehtiva edir. , resursların təsviri və s.
Ümumi fəaliyyətlərin avtomatlaşdırılması vəzifəsi kontekstində istifadəçinin "özünəxidmət" rejimində işinin özəlliyi o deməkdir ki, sistem istehlakçının tapılan məlumatın emalı üçün funksiyalarına dəstək verən mühit təmin etməlidir. eləcə də ənənəvi olaraq informasiya vasitəçisinin funksiyaları ilə əlaqəli olanlar (sorğunun təfsiri, onun informasiya axtarış dilinə tərcüməsi, IR seçimi, avtomatlaşdırılmış axtarış və materialların əl ilə seçilməsi), həm də aşağıdakı kimi “dəstəkləyici” funksiyalar: informasiya ehtiyaclarının strukturlaşdırılması. , həm ayrıca sənəd, həm də ümumilikdə informasiya resursları səviyyəsində sorğunun leksik uyğunlaşdırılması, axtarış nəticələrinin qiymətləndirilməsi, sistemləşdirilməsi və işlənməsi. İstifadəçinin malik olduğu texniki imkanlar ona informasiya resursu yaratmağa - massivləri formalaşdırmaq, sistemləşdirmək və öz və ya xarici istifadə üçün onların məzmununun xarici təsvirlərini yaratmaq imkanı verir.
IPS bölünür: ənənəvi (əl, mexaniki, elektromexaniki) və avtomatlaşdırılmış (elektron).
Avtomatlaşdırılmış informasiya sistemləri (AIPS), kompüter proqram təminatı və aparat alətləri və texnologiyalarından istifadə edir və müəyyən edilmiş meyarlara uyğun olaraq istifadəçiləri tapmaq və məlumatla təmin etmək məqsədi daşıyır. Axtarış avtomatlaşdırma üsullarını başa düşmək üçün aşağıdakı iki amil həlledicidir:
Müqayisə olunan obyektlərin özləri deyil, təsvirlər - sözdə "axtarış şəkilləri";
prosesin özü mürəkkəbdir (kompozit və bir addımlı deyil) və adətən əməliyyatlar ardıcıllığı ilə həyata keçirilir.
Məlumatlar xüsusi hazırlanmış daxiletmə formatları əsasında AIPS-ə daxil edilir. İnformasiya axtarış sistemində bir obyekt haqqında bütün məlumatlar cədvəlin bir cərgəsini təşkil edən sistemləşdirilmiş məlumatlar şəklində təqdim olunur və adlanır. qeyd . Bundan əlavə, əgər IRS kitabxananın elektron kataloqunu təmsil edirsə, onda sənədin hər hansı biblioqrafik təsviri (BD) BD elementlərinin sayına bərabər olan sahələrdən ibarət bir qeyddir. Qeydlər toplusu adətən bir faylda saxlanılan verilənlər bazasını təşkil edir. Bir DBMS tərəfindən birləşdirilən verilənlər bazası toplusu məlumat bankını təşkil edir.
AIPS-dən bəriadamın axtarış zamanı istifadə etdiyi alət (lakin yoxağıllı axtarış maşını informasiya - əsas fəaliyyətin problemlərinin həlli üçün hazır həllər), ondan istifadənin effektivliyi bir insanın əməliyyat obyektlərinin təbiətini və bu obyektlərlə işlədiyi alətin xüsusiyyətlərini nə dərəcədə yaxşı bilməsindən asılıdır.
İnformasiya axtarışı müəyyən strategiyaların, metodların, mexanizmlərin və vasitələrin istifadəsini nəzərdə tutur. Axtarış prosesini idarə edən istifadəçinin davranışı təkcə məlumat ehtiyacı ilə deyil, həm də sistemin instrumental müxtəlifliyi - sistemin təqdim etdiyi texnologiya və alətlər ilə müəyyən edilir.
Axtarış strategiyası – həm məqsədin xarakteri və axtarış növü, həm də sistemin “strateji” qərarları ilə müəyyən edilən istifadəçinin informasiya ehtiyaclarını ifadə etmək və ödəmək üçün sistemin və ya istifadəçi davranışının ümumi planı (konsepsiya, üstünlük, parametr) - verilənlər bazası arxitekturası, axtarış xüsusi AIPS-də üsul və vasitələr.
Ümumi halda strategiya seçimi optimallaşdırma problemidir. Praktikada o, əsasən praktiki ehtiyaclar və mövcud vasitələrin imkanları arasında kompromis əldə etmək sənəti ilə müəyyən edilir.
Axtarış üsulu – ayrı-ayrı texnoloji mərhələlərin həyata keçirilməsi üçün modellər və alqoritmlər toplusu: axtarış sorğusu təsvirinin (SQI) qurulması, sənəd seçimi (axtarış sorğusu şəkillərinin və sənədlərinin müqayisəsi), sorğunun genişləndirilməsi və yenidən formalaşdırılması, nəticələrin lokallaşdırılması və qiymətləndirilməsi.
Axtarış sorğu şəkli– informasiya sorğusunun semantik məzmununu ifadə edən və informasiya axtarışının ən effektiv həyata keçirilməsi üçün lazım olan təlimatları özündə əks etdirən İPY-də yazılmış mətn.
Axtarış üsulları, yəni. Potensial olaraq sənəd seçimi (DS) probleminin həllinin təsvirini ehtiva edən sənədlər alt toplusunun müəyyən edilməsi həll yolunun tapılması prosesinin əksidir və problemin xarakterindən və mövzu sahəsindən asılıdır.
Axtarışı iterativ bir proses kimi nəzərə alaraq, axtarış sahəsini (axtaran alt çoxluq) azaltma üsulları mahiyyətcə axtarış strategiyasının metodoloji əsasını təşkil edir və aşağıdakı siniflərə - axtarış metodlarına bölünə bilər:
bir boşluq (adətən tematik);
iyerarxik qaydada yerləşdirilmiş məkan;
alternativ boşluqlar;
dinamik (axtarış zamanı dəyişən) məkan.
POS-un qurulması üçün həyata keçirilən üsul müxtəlif növ məqsədlərə çatmaq üçün sorğunun qurulmasının effektiv yollarını təmin etməlidir.
Axtarış motorları – axtarış sorğusuna cavab olaraq sənədlərin verilməsi prosesi üçün sistemdə həyata keçirilən modellər və alqoritmlər toplusu.
Axtarış alətləri , bir tərəfdən, emal obyektlərinin (sənədlər, lüğətlər, axtarış nəticələri dəstləri) struktur və semantik transformasiyalarını təmin edən məlumat axtarış dilləri (IRL) və məlumatların müəyyən edilməsi/idarəetmə dillərinin qarşılıqlı asılı kompleksidir, digər tərəfdən, xüsusi AIPS-in əməliyyat obyektlərinin seçilməsinin idarəetmə ardıcıllığını təmin edən istifadəçi interfeysi obyektləri.
Axtarış texnologiyaları ardıcıl olaraq yekun və aralıq nəticələri əldə etmək üçün istifadəçinin sistemlə qarşılıqlı əlaqəsi prosesində fərdi axtarış vasitələrindən səmərəli istifadə üçün vahid (müəyyən AIPS çərçivəsində optimallaşdırılmış) ardıcıllıqlardır.
Naviqasiya seçilmiş verilənlər bazasında sorğu axtarış prosesinin həyata keçirilməsi kimi - nəticəni əldə etmək və qiymətləndirmək üçün konkret AIPS-in metodlarından, alətlərindən və texnologiyalarından istifadənin məqsədyönlü, strategiya ilə müəyyən edilmiş ardıcıllığı.
Naviqasiya yardımçıları istifadəçiyə axtarış prosesinə nəzarət etmək imkanı verir. Onlar istifadəçiyə formada təqdim olunurinterfeys , verilənlər bazası ilə az və ya çox səmərəli qarşılıqlı əlaqə prosesini təşkil etməyə imkan verir. Eyni zamanda, interfeysin "dostluğu" təkcə erqonomika və aydınlıq ilə deyil, həm də əməliyyat obyektlərinin müxtəlifliyi ilə xarakterizə olunur.
İnformasiyanın axtarışı prosesi sistem vasitəsilə müəyyən nəticəyə gətirib çıxaran və onun tamlığını qiymətləndirməyə imkan verən addımlar ardıcıllığını ifadə edir. İstifadəçi adətən axtarış apardığı resursun informasiya məzmunu haqqında hərtərəfli biliyə malik olmadığından o, sorğu ifadəsinin adekvatlığını, eləcə də əldə edilmiş nəticənin tamlığını yalnız xarici qiymətləndirmələrə və ya aralıq göstəricilərə əsasən qiymətləndirə bilər. nəticələr və ümumiləşdirmələr, məsələn, əvvəlkilərlə müqayisə.
Axtarış prosesi aşağıdakı əsas komponentlər kimi təqdim edilə bilər:
sorğunun təbii dildə formalaşdırılması, axtarış sistemlərinin və xidmətlərinin seçilməsi, sorğunun müvafiq FL-də rəsmiləşdirilməsi;
bir və ya bir neçə axtarış sistemində axtarış aparmaq;
əldə edilmiş nəticələrin nəzərdən keçirilməsi (linklər);
əldə edilmiş nəticələrin ilkin işlənməsi: bağlantıların məzmununa baxmaq, müvafiq və müvafiq məlumatların çıxarılması və saxlanması;
zəruri hallarda sorğunun dəyişdirilməsi və əldə edilmiş nəticələrin sonradan işlənməsi ilə təkrar (təmizləmə) axtarışının aparılması.
Seçilmiş materialların həcmini azaltmaq üçün axtarış nəticələri mənbələrin növü (saytlar, portallar), mövzular və digər əsaslarla süzülür.
İstifadə olunan axtarış texnologiyalarına görə IP-ni 4 kateqoriyaya bölmək olar:
tematik kataloqlar;
İxtisaslaşdırılmış kataloqlar (onlayn kataloqlar);
Axtarış motorları (tam mətn axtarışı);
Meta axtarış vasitələri.
İnternetdə məlumat axtarış sistemi bir və ya bir neçə serverdə yerləşdirilir. IPS, sistemin xidmət etdiyi veb serverlər qrupunda mövcud olan sənədlər haqqında məlumatları toplayır, indeksləşdirir və qeydiyyatdan keçirir. Sənədlərdəki hər şey indekslənib mənalı sözlər və ya sadəcə başlıqlardakı sözlər.
Mövzu kataloqları sənədlərin işlənməsini və siyahısı əvvəlcədən müəyyən edilmiş bir neçə kateqoriyadan birinə aid edilməsini təmin edir. Bu, mahiyyətcə təsnifata əsaslanan indeksləşdirmədir. İndeksləşdirmə məşhur veb-saytları gəzən və xülasə sənədlərin (açar sözlər, mücərrəd, mücərrəd) qısa təsvirini tərtib edən mütəxəssislərin köməyi ilə avtomatik və ya əl ilə həyata keçirilə bilər.
Xüsusi kataloqlar və yaistinad kitabları xüsusi sənayelər və mövzular, xəbərlər, şəhərlər, e-poçt ünvanı və s.
Axtarış motorları (İnternetdə ən qabaqcıl axtarış vasitəsi) tam mətnli axtarış texnologiyasını həyata keçirir. Sorğu edilən serverlərdə yerləşən mətnlər indekslənir. İndeksdə bir neçə milyon sənəd haqqında məlumat ola bilər. Məsələn, məşhur IRS "AltaVista" indeksində 56 milyondan çox URL var.
Vəsaitlərdən istifadə edərkənmeta-axtarış sorğu eyni vaxtda bir neçə axtarış motoru tərəfindən həyata keçirilir. Axtarış nəticəsi uyğunluğa görə sıralanmış ümumi siyahıda birləşdirilir. Hər bir sistem axtarış bazasını genişləndirməyə imkan verən şəbəkə qovşaqlarının yalnız bir hissəsini emal edir. Bu sinfə öz meta-axtarış alətlərinizi yaratmağa imkan verən “şəxsi axtarış proqramları” daxildir (məsələn, tez-tez ziyarət edilən qovşaqları avtomatik sorğulayın).
Məlumat bazaları demək olar ki, hər hansı bir məlumatı, o cümlədən istənilən kombinasiyanı ehtiva edə bilər. İnformasiya axtarışı həm tam mətnli EIR-də mövcud olan terminlər, həm də İƏM-ə daxil olan xüsusi elementlər vasitəsilə həyata keçirilir. Sorğu yaratmaq üçün xüsusi məlumat axtarış dillərindən istifadə olunur.
Tapılan nümunə daxilindəki IRS-lər adətən sənədləri öz sırasına uyğunlaşdırmağa çalışırlar.aktuallıq ", yəni istifadəçinin daxil etdiyi sorğuya yaxınlıq. Belə yaxınlıq üçün bir çox meyar var və sorğuya "məna baxımından" yaxın olan sənədlərin müəyyən edilməsi müvafiq sənəd olmadıqda məlumat əldə etmək problemini həll etmir. Bu vəziyyət olduqca əhəmiyyətsizdir, o cümlədən istifadəçi tez-tez özünün yazacağı sənədi axtarır.Qeyd etmək lazımdır ki, axtarış nəticəsində istifadəçi həm müvafiq, həm uyğun, həm də əhəmiyyətsiz və qeyri-müvafiq məlumat alt massivləri.
IPA-lar əslindəinformasiya dəstəyi sistemləriməlumat bazalarını və məlumat banklarını təmsil edir. kimiobyektonlar fərdi, təşkilatı, sənayeni, bölgəni və s.İnformasiya dəstəyinin mövzusuinformasiya mütəxəssisi, istənilən informasiya istehlakçısıdır.
Axtarış təşkilatı
Lazımi məlumatların tapılması prosedurunun doqquz əsas mərhələyə bölünməsi təklif olunur:
Bilik sahəsinin tərifi;
Məlumatların növünün və mənbələrinin seçilməsi;
İnformasiya modelini doldurmaq üçün lazım olan materialların toplanması;
Ən faydalı məlumatların seçilməsi;
İnformasiyanın emalı metodunun seçilməsi (təsnifat, klasterləşdirmə, reqressiya təhlili və s.);
Nümunə axtarış alqoritminin seçilməsi;
Toplanmış məlumatlarda nümunələri, formal qaydaları və struktur əlaqələri axtarın;
Alınan nəticələrin yaradıcı təfsiri;
Çıxarılan “biliklərin” inteqrasiyası.
Axtarış aparmaq üçün müvafiq verilənlər bazası ilə işləmək üçün interfeys əvvəlcə istifadəçinin kompüterinə yüklənir. Bu yerli və ya uzaq verilənlər bazası ola bilər. Əvvəlcə axtarışın növünə qərar verməlisiniz (sadə, inkişaf etmiş və s.). Sonra axtarış üçün təklif olunan bir sıra sahələr ilə. IRS giriş üçün bir və ya daha çox sahə təklif edə bilər. Sonuncu halda bunlar adətən aşağıdakı sahələrdir: müəllif, başlıq (ad), müddət, sənədin növü, açar sözlər, başlıqlar və s. Sorğu formalaşdırarkən, demək olar ki, bütün sistemlər məntiqi elementlərdən istifadə etməyə imkan verir “VƏ”, "YA YOX".
İnformasiya axtarışı texnologiyaları
İnformasiya ehtiyaclarını ödəmək üçün istifadə olunan axtarış vasitələri və texnologiyaları istifadəçinin əsas fəaliyyət probleminin növü və vəziyyəti ilə müəyyən edilir: onun biliyi və öyrənilən obyekt haqqında məlumatsızlığının nisbəti. Bundan əlavə, istifadəçinin sistemlə qarşılıqlı əlaqəsi prosesi istifadəçinin resursun məzmunu (təqdimatın tamlığı, mənbənin etibarlılığı və s.) və sistemin bir alət kimi funksionallığı ilə bağlı bilik səviyyəsi ilə müəyyən edilir. Ümumiyyətlə, bu amillər adətən “peşəkarlıq” anlayışına düşür - məlumat xarakterli (təlimli/təlimsiz istifadəçi) vəmövzu (peşəkar/peşəkar olmayan)"peşəkarlıq ".
İnformasiya axtarışı prosesi adətən empirik xarakter daşıyır. Bu, sistemin tamlığını qiymətləndirməyə imkan verən müəyyən bir nəticəyə aparan addımlar ardıcıllığını təmsil edir. Eyni zamanda, axtarış prosesinin idarə edilməsinin təşkiledici başlanğıcı kimi istifadəçi davranışı təkcə məlumat ehtiyacı ilə deyil, həm də sistem tərəfindən təqdim olunan müxtəlif strategiyalar, texnologiyalar və alətlər ilə motivasiya olunur.
Bir qayda olaraq, istifadəçi axtarış apardığı resursun informasiya məzmunu haqqında hərtərəfli biliyə malik deyildir, ona görə də o, sorğu ifadəsinin adekvatlığını, eləcə də əldə edilmiş nəticənin tamlığını əlavə məlumat tapmaqla və ya prosesin elə təşkili ki, axtarış nəticələrinin bir hissəsi digər hissənin adekvatlığını təsdiq və ya inkar etmək üçün istifadə olunsun.
İstifadəçilərin axtarış sistemi ilə qarşılıqlı əlaqəsində bilavasitə iştirak edən əməliyyat obyektləri sənədin axtarış təsviri (SID) və uyğunluğu AIPS axtarış mexanizmi tərəfindən formal səviyyədə qurulan DİM-dir. Şəklin sənədin faktiki məzmununa adekvatlığı məlumatın çevrilməsi prosesinin keyfiyyəti və subyektin əks etdirmə vasitələri haqqında bilik səviyyəsi - mövzu sahəsinin konseptual diaqramı və FP-nin imkanları ilə müəyyən edilir.
Sənəd şəklini axtarın– FL-də ifadə olunan və bu sənədin əsas semantik məzmununu və ya sorğu əsasında axtarış üçün zəruri olan hər hansı digər xüsusiyyətlərini xarakterizə edən sənədin təsviri.
Əksər PS ilkin olaraq istifadəçilərə BO və ya müxtəlif AIPS-lərdə saxlanılan tam və ya qismən sənədlərə, onların təsvirlərinə və s. bağlantılar təklif edir. Müasir proqram təminatı məlumat mənbəyinin istifadəçini nə və hansı formada maraqlandırdığını qərara almağa və göstərməyə imkan verir.
Axtarış nəticələrinin işlənməsi üsulları
Dəyişikliklərin xarakterindən (nəticələrin emalının sonrakı istifadəsi kontekstində) axtarış nəticələrinin işlənməsi üsullarını iki qrupa bölmək olar:
Struktur və format çevrilmələri;
Struktur-semantik çevrilmələr (informasiya-analitik, məntiqi-semantik).
Axtarışın həyata keçirilməsi
İnternetdə ən çox axtarılanlar: fərdlər və təşkilatlar haqqında şəxsi məlumatlar; müxtəlif ünvan məlumatları; xüsusi materiallar (məqalələr, kitablar, fotoşəkillər, istinad məlumatları, proqram təminatı və s.), o cümlədən onların saxlanma yeri; müəyyən materialların, xidmətlərin, məhsulların və s. harada və nə qədər başa gəlir; məlumat saytları və portalları və s.
Sözün ilkin fraqmentləri üzrə axtarışın təşkili ümumiyyətlə qəbul edilir (sağda kəsilmə ilə axtarış), məsələn, “kitabxana” sözünün əvəzinə onun “kitabxana*” fraqmentini daxil edə bilərsiniz. Bu zaman təkcə “kitabxana” sözünü deyil, həm də “kitabxana”, “kitabxanaçı”, “kitabxanaşünaslıq” və s.-dən ibarət sənədlər tapılacaq. Hər bir halda istifadəçi tam olaraq nə tapmaq istədiyini təsəvvür etməlidir, ona təklif olunan variantda, verilən sözü tam (kəsmə olmadan) göstərdikdə daha çox sayda sənəd tapılacaqdır. Belə olan halda, alınan məlumat massivində dəqiqləşdirici axtarış aparmaq və nəticədə daha aktual və uyğun məlumatlar əldə etmək mümkündür.
Nəticələrin qeydiyyatı
İnformasiya axtarış sistemi nöqteyi-nəzərindən onun içindəki axtarış nəticəsi tapılmış sənədlərin və ya onlara keçidlərin toplusudur (alt çoxluğu). Adətən istifadəçiyə siyahı şəklində təqdim olunur. Yəni, bu halda ən sadə çıxış forması MN tərəfindən tapılan tam və ya qismən BO-lar şəklində keçidlərin siyahısı olacaqdır. Belə bir imkan IPS tərəfindən təmin edilirsə və istifadəçi İnternetə qoşulursa, belə bir siyahı dərhal çap edilə bilər və ya istənilən e-poçt ünvanına göndərilə bilər.
Qrafik və tam mətnli EIR istifadəçiyə yalnız baxmaq, müxtəlif formatlarda və miqyasda tam və ya qismən surət çıxarmaq üçün təklif oluna bilər. Qrafik IR-lər adətən JPG, GIFF, TIFF, BMP və s. kimi ümumi qəbul edilmiş formatlarda mövcuddur və mətn materialları üçün adətən TXT, DOC və s. mətn formatlarından istifadə edirlər, HTML və PDF əslində qrafik formatdır. mətn, eləcə də qrafik məlumat kimi saxlanıla bilər.
Axtarış nəticəsində əldə edilən sənədlər saxlanılır.
Axtarış Qiymətləndirmə Meyarları
Axtarış nəticəsi meyarı ondan ibarətdir ki, istifadəçi axtarış sorğusunda tərtib edildiyi kimi onun ehtiyaclarına ən yaxşı cavab verən sənədlərin siyahısını, bir sənəd və ya onun hissələrini alır. IRS-də axtarış nəticəsində əldə edilən sənədlərin siyahısını aktuallığına uyğun formalaşdırmaq adətdir. Axtarış göstərişi ilə verilmiş sənəd arasında semantik və formal uyğunluq meyarları mövcuddur.
Bu mövzunu öyrəndikdən sonra öyrənəcək və təkrarlayacaqsınız:
Axtarış serverləri nə üçündür?
- axtarış serverlərinin əsas hissələrinin təyinatı;
- İnternetdə məlumat axtarışının hansı növləri mövcuddur;
- Yandex axtarış sistemində sorğu yaratmaq üçün əsas qaydalar.
URL ilə axtarın
İnternetdə məlumat axtarmağın ən sürətli və etibarlı yolu URL ilə axtarış etməkdir. Onların bir çoxu çap nəşrlərində, xüsusi arayış kitablarında təqdim olunur, məşhur radio stansiyalarında və televiziya ekranlarında eşidilir.
♦ Zenit futbol klubunun azarkeşləri www.fc-zenit.ru ünvanını əzbər bilirlər.
♦ “Kral və Zarafat” qrupunun pərəstişkarları bu qrupun www.korol.spb.ru rəsmi saytından yaxşı xəbərdardırlar.
♦ NTV kanalının pərəstişkarları onun saytını asanlıqla www.ntv.ru saytında tapa bilərlər. Yuxarıdakı resurslara tez daxil olmaq üçün sadəcə olaraq Internet Explorer kimi brauzer proqramını işə salın və ünvan çubuğuna tanış URL yazın.
Axtarış motorları
İnternetdə cəmlənmiş çoxlu sənədlər var. Lazımi məlumatların tapılmasını asanlaşdırmaq üçün xüsusi axtarış sistemləri yaradılır.
Axtarış motorları- bunlar qlobal şəbəkəyə qoşulmuş serverləri sorğulayan və serverlərdə mövcud olan məlumatlar haqqında məlumat bazasında məlumat saxlayan avtomatik sistemlərdir. Xüsusi tərtib edilmiş sorğu əsasında axtarış motorları lazımi məlumatları haradan əldə edə biləcəyiniz barədə məlumat verir.
Tipik olaraq, axtarış motorları üç hissədən ibarətdir: robot, indeks və sorğuların işlənməsi proqramı.
♦ Robot (Hörümçək, Robot və ya Bot) internet səhifələrinə daxil olan və onların məzmununu oxuyan (tamamilə və ya qismən) proqramdır. Axtarış motoru robotları veb səhifənin məzmununu təhlil etmək üçün fərdi sxemləri ilə fərqlənir.
♦ Axtarış motoru indeksi robotların ziyarət etdiyi səhifələrin axtarış şəkillərinin deposudur. Sənədin axtarış şəkli (veb-səhifə də daxil olmaqla) sənədin məzmununun xüsusi informasiya axtarışı dilində təsviridir. Bu təsvirdə onun mənasını və məzmununu əks etdirən sənəd açar sözlərinin kodları var. Hər bir axtarış sistemindəki indekslər saxlanan məlumatın həcmi və təşkili üsulu ilə fərqlənir. Aparıcı axtarış sistemlərinin məlumat bazaları on milyonlarla sənəd haqqında məlumat saxlayır və onların indeks həcmi yüzlərlə giqabayt təşkil edir. İndekslər vaxtaşırı yenilənir və əlavə olunur, buna görə axtarış müxtəlif vaxtlarda aparılıbsa, eyni sorğu ilə bir axtarış sisteminin nəticələri fərqli ola bilər.
♦ Sorğu Emalı Proqramı istifadəçinin sorğusuna uyğun olaraq, lazımi məlumatların olub-olmaması üçün indeksə "baxan" və tapılan sənədlərə keçidləri qaytaran bir proqramdır. Sistemin çıxışındakı bağlantılar dəsti proqram tərəfindən aktuallığın azalan ardıcıllığı ilə paylanır, yəni keçidin ən böyük uyğunluq dərəcəsindən sorğuya qədər ən kiçiyə qədər.
Hal-hazırda, Rusiya İnternet istifadəçiləri üçün ən populyar üç böyük indeks tipli axtarış motorlarıdır:
Bu sistemlər rus dilinin qrammatik xüsusiyyətlərini nəzərə alır, ona görə də onların rusdilli resurslarda axtarış nəticələri Qərb sistemləri ilə müqayisədə daha keyfiyyətli olur.
Axtarış sistemləri informasiya resurslarının əhatə dairəsinə görə fərqlənirlər:
♦ ümumi axtarış sistemləri bütün bilik sahələri üzrə məlumat bazasına malikdir və geniş indeksi və böyük həcmdə yığılmış informasiya ilə seçilir;
♦ Xüsusi təyinatlı axtarış sistemləri yalnız musiqi və ya muzey kimi konkret mövzuya aid saytlara baxır.
Axtarış motorlarının əsas xüsusiyyətləri bunlardır:
♦ indeksdə olan sənədlərin həcmi;
♦ informasiyanın yenilənməsi tezliyi;
♦ axtarış motoru robotunun əhatə etdiyi informasiya məkanı və məlumatların toplandığı sənəd növlərinin müxtəlifliyi;
♦ sorğunun emal sürəti;
♦ aktuallığın müəyyən edilməsi meyarı (tapılan sənədin axtarış sorğusuna uyğunluğu);
♦ sorğunu təfərrüatlandırmaq və aydınlaşdırmaq imkanı.
Axtarış motoru kateqoriyasına görə axtarın
Axtarış qovluqları digər İnternet resurslarına keçidlərin sistematik toplusudur (seçimi). Bağlantılar iyerarxik struktur olan tematik rubrikator şəklində təşkil edilir, bu keçid vasitəsilə sizə lazım olan məlumatları tapa bilərsiniz.
Nümunə olaraq axtarış sisteminin strukturunu verək onlayn kataloq Yandex. Bu ümumi təyinatlı kataloqdur, çünki demək olar ki, bütün mümkün sahələrdə İnternet resurslarına keçidləri ehtiva edir. Bu kataloqda aşağıdakı mövzular vurğulanır:
♦ Biznes və iqtisadiyyat;
♦ Kataloqlar və keçidlər;
♦ Cəmiyyət və siyasət;
♦ Ev və ailə;
♦ Elm və təhsil;
♦ Əyləncə və istirahət;
♦ Kompüterlər və rabitə;
♦ Mədəniyyət və incəsənət.
Hər bir mövzu bir çox alt bölmələri ehtiva edir və bunlar da öz növbəsində başlıqları və s.
Tutaq ki, siz Qələbə Günü üçün tədbir hazırlayırsınız və İnternetdə Bulat Okudjavanın məşhur hərbi mahnısı olan “Çəkmələrin cingildədiyini eşidirsiniz” sözlərini tapmaq istəyirsiniz. Axtarış aşağıdakı kimi təşkil edilə bilər: Yandex Kataloq Mədəniyyət və İncəsənət Musiqi Müəllif mahnısı.
Bu axtarış üsulu olduqca sürətli və effektivdir. Sonda sizə yalnız 5 keçid təklif olunur, onların arasında məşhur bardların mahnıları olan saytlara keçidlər var. Yalnız veb saytında B. Okudjavanın mahnılarının sözləri olan arxivi tapmaq və oradan istədiyiniz mətni seçməkdir.
Başqa bir misal. Tutaq ki, siz alacaqsınız mobil telefon və müxtəlif şirkətlərin cihazlarının xüsusiyyətlərini müqayisə etmək istəyirəm. Axtarış aşağıdakı kataloq başlıqlarına uyğun aparıla bilər: Yandex Kataloq Kompüterlər və rabitə Mobil rabitə Mobil telefonlar.
Məhdud sayda keçid aldıqdan sonra siz şirkətlərin xüsusiyyətlərini və cihazların modifikasiyalarını araşdıraraq onlara tez baxa və telefon seçə bilərsiniz.
Açar sözlərlə axtarın
Əksər axtarış motorları açar sözlə axtarış etmək imkanına malikdir. Bu ən çox yayılmış axtarış növlərindən biridir. Açar sözlərdən istifadə etməklə axtarış etmək üçün xüsusi pəncərədə axtarmaq istədiyiniz sözü və ya bir neçə sözü daxil edib Axtarış düyməsini sıxmaq lazımdır. Axtarış motoru öz verilənlər bazasında bu sözləri ehtiva edən sənədləri tapıb göstərəcək. Bu cür sənədlər çox ola bilər, lakin bu vəziyyətdə çox şey mütləq yaxşı demək deyil.
Axtarış motorlarından hər hansı biri ilə bir neçə təcrübə aparaq. Tutaq ki, biz akvariuma başlamaq qərarına gəldik və bu mövzuda hər hansı bir məlumatla maraqlanırıq.
İlk baxışdan ən sadə şey “akvarium” sözünü axtarmaqdır. Bunu, məsələn, Yandex axtarış sistemində yoxlayaq. Axtarış nəticəsi 3500 saytda 460 000-dən çox səhifə olacaq - çoxlu sayda keçid. Üstəlik, daha yaxından baxsanız, onların arasında B. Qrebenshchikovun "Akvarium" qrupunu, ticarət mərkəzlərini və eyni adlı qeyri-rəsmi birlikləri xatırladan saytlar və akvarium balıqları ilə heç bir əlaqəsi olmayan daha çox şeylər olacaq.
Belə bir axtarışın ən təvazökar istifadəçini belə qane edə bilməyəcəyini təxmin etmək çətin deyil. Bütün təklif olunan sənədlər arasından bizə lazım olan mövzuya aid olanları seçməyə və daha çox onların məzmunu ilə tanış olmağa çox vaxt sərf etməli olacaq.
Dərhal belə nəticəyə gələ bilərik ki, bir sözlə axtarış etmək, bir qayda olaraq, qeyri-mümkündür, çünki bir sözdən istifadə etməklə sənədin, veb-səhifənin və ya saytın həsr olunduğu mövzunu müəyyən etmək çox çətindir. İstisna, tematik zonasından kənarda demək olar ki, heç vaxt istifadə olunmayan nadir sözlər və terminlərdir.
Axtarış şərtlərini aydınlaşdırmağa və "akvarium balığı" ifadəsini daxil etməyə çalışaq. Axtarış nəticəsi 20.000 səhifədən bir qədər çox və təxminən 650 sayt olacaq. Göründüyü kimi, keçidlərin sayı 20 dəfədən çox azalıb. Bu nəticə bizə daha çox yaraşır, lakin təklif olunan linklər arasında, məsələn, balıq təsvirləri olan kibrit etiketlərinin rus suvenir dəstləri, kompüter masası üçün ekran qoruyucuları kolleksiyaları, fotoşəkilləri olan akvarium balıqlarının kataloqları və akvarium aksesuarları ola bilər. mağazalar.
Aydındır ki, biz axtarış şərtlərinin aydınlaşdırılması istiqamətində irəliləməyə davam etməliyik.
Axtarışı daha məhsuldar etmək üçün bütün axtarış sistemlərində öz sintaksisi olan xüsusi sorğu dili var. Bu dillər bir çox cəhətdən oxşardır. Onların hamısını öyrənmək kifayət qədər çətindir, lakin istənilən axtarış sistemində istədiyiniz dili mənimsəməyə imkan verəcək yardım sistemi var.
Yandex axtarış sistemində sorğu yaratmaq üçün on sadə qayda.
1. Sorğuda açar sözlər kiçik (kiçik) hərflərlə yazılmalıdır. Bu, yalnız böyük hərflə başlayanların deyil, bütün açar sözlərin axtarılmasını təmin edəcək.
2. Axtarış zamanı sorğuda sözün formasından asılı olmayaraq rus dilinin qaydalarına uyğun olaraq sözün bütün formaları nəzərə alınır. Məsələn, əgər sorğuda “bilmək” sözü göstərilibsə, o zaman “biz bilirik”, “sən bilirsən” və s. sözləri də axtarış şərtini ödəyəcək.
3. Sabit bir ifadə tapmaq üçün sözləri dırnaq işarəsinə daxil etməlisiniz, məsələn, "çini qablar".
4. Dəqiq söz forması ilə axtarmaq üçün sözün qarşısına nida işarəsi qoymaq lazımdır. Məsələn, “sentyabr” sözünü genitiv halda axtarmaq üçün “!Sentyabr” yazmalısınız.
5. Bir cümlə daxilində axtarış etmək üçün sorğudakı sözlər boşluq və ya & işarəsi ilə ayrılır: “macəra romanı” və ya “macəra və roman”. Sorğuda boşluqlarla ayrılmış bir neçə söz, onların hamısı axtarılan sənədin bir cümləsinə daxil edilməli olduğunu bildirir.
6. Yalnız sorğuda göstərilən hər bir sözü ehtiva edən sənədlərin seçilməsini istəyirsinizsə, onların hər birinin qarşısında üstəlik “+” işarəsi qoyun. Əksinə, axtarış nəticəsindən hər hansı bir sözü çıxarmaq istəyirsinizsə, bu sözün qarşısına mənfi “-” qoyun. “+” və “-” işarələri əvvəlkindən boşluq qoyularaq növbəti sözlə birlikdə yazılmalıdır. Məsələn, "Volqa-avtomobil" sorğusunda "avtomobil" sözünü deyil, "Volqa" sözü olan sənədləri tapa bilərsiniz.
7. Sinonimləri və ya oxşar mənaları olan sözləri axtararkən sözlər arasında şaquli “|” işarəsi qoya bilərsiniz. Məsələn, “uşaq | körpə | körpə” sözlərindən hər hansı birinin olduğu sənədlər tapılacaq.
8. Sorğuda bir söz əvəzinə, bütün ifadəni əvəz edə bilərsiniz. Bunu etmək üçün onu mötərizədə qoymaq lazımdır, məsələn, “(uşaq | körpə | uşaqlar | körpə) + (qulluq | təhsil).”
9. *~" (tilde) işarəsi ikinci sözü deyil, birinci sözü olan cümlə ilə sənədləri tapmağa imkan verir. Məsələn, "kitablar ~ mağaza" sorğusu "kitablar" sözünü ehtiva edən bütün sənədləri tapacaq, yanında (cümlə daxilində) "mağaza" sözü yoxdur.
10. Operator bir dəfə təkrarlanırsa (məsələn, & və ya ~), axtarış cümlə daxilində aparılır. Qoşa operator (&&, -) sənəd daxilində axtarışı təyin edir. Məsələn, "xərçəng - astrologiya" sorğusu astrologiya ilə əlaqəli olmayan "xərçəng" sözü olan sənədləri tapacaqdır.
İstədiyiniz sahədə ən çox yayılmış terminlərin müəyyən bir dəstinə sahib olmaqla, inkişaf etmiş axtarışdan istifadə edə bilərsiniz. Şəkildə. Şəkil 3.3 Yandex axtarış sistemində təkmil axtarış pəncərəsini göstərir. Bu rejimdə sorğu dilinin imkanları forma şəklində həyata keçirilir. Bənzər bir xidmət, o cümlədən lüğət filtrləri, demək olar ki, bütün axtarış sistemləri tərəfindən təklif olunur.
düyü. 3.3. Yandex sistemində inkişaf etmiş axtarış nümunəsi
İstənilən və tələb olunan sözləri düzgün seçmək və arzuolunmaz terminləri istisna etmək şərti ilə belə bir axtarış yaxşı nəticə verə bilər.
Akvarium balıqları ilə nümunəyə qayıdaq. Axtarış motorunun təklif etdiyi bir neçə sənədlə tanış olduqdan sonra məlum olur ki, internetdə məlumat axtarışı akvarium balıqlarının seçilməsi ilə başlamamalıdır. Akvarium mürəkkəb bioloji sistemdir, onun yaradılması və saxlanması xüsusi bilik, vaxt və ciddi investisiya tələb edir.
Alınan məlumatlara əsasən, İnternetdə axtarış aparan şəxs öyrənilən məsələ ilə bağlı xüsusi ədəbiyyatı öyrənmək qərarına gələrək sonrakı axtarış strategiyasını kökündən dəyişə bilər.
Ədəbiyyat və ya tam mətn sənədləri axtarmaq üçün aşağıdakı sorğu mümkündür:
“+(akvarium | akvarist | akvarium hobbisi) + yeni başlayanlar üçün + (məsləhət | ədəbiyyat) + (məqalə | tezis | tam mətn) - (qiymət | mağaza | çatdırılma | kataloq).”
Sorğu axtarış sistemi tərəfindən işləndikdən sonra aşağıdakı nəticə əldə edildi: səhifələr - 195, saytlar - ən azı 43.
Axtarış statistikasından da göründüyü kimi, nəticə çox uğurlu olmuşdur. Artıq ilk bağlantılar tələb olunan sənədlərə gətirib çıxarır:
Akvariumun yerləşdirilməsi > Başlayan akvariumçu üçün məsləhətlər >
Məqalələr > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - ciddi uyğunluq.
BAŞLANAN AKVARİUMİSTLƏR ÜÇÜN MƏSLƏHƏT. Akvariumu necə seçmək və quraşdırmaq, necə...
http://www.aquariums.ru/sovna.htm (2KB) 07/23/2002 - qeyri-ciddi uyğunluq.
İndi axtarış nəticələrini ümumiləşdirə, müəyyən nəticələr çıxara və mümkün hərəkətlərə qərar verə bilərsiniz:
♦ Əlavə axtarışı dayandırın, çünki müxtəlif səbəblərdən akvarium saxlamaq iqtidarında deyilsiniz.
♦ Təklif olunan məqalələri oxuyun və akvarium qurmağa başlayın.
♦ Hamster və ya budgies haqqında materialları axtarın.
Peşəkar axtarış
Tədqiqatçılar və mütəxəssislər axtarışın təşkilinə daha düşünülmüş yanaşmalı olacaqlar. İnternetdə peşəkar şəkildə məlumat axtararkən aşağıdakı tələblər yerinə yetirilməlidir:
♦ yüksək axtarış sürəti;
♦ alınan məlumatların etibarlılığı;
♦ axtarış zamanı resursların tam əhatə olunması.
Sürət. Axtarışın sürəti əsasən iki amildən asılıdır: səriştəli axtarış planlaması (axtarış xidmətləri və vasitələrinin seçilməsi) və artıq seçilmiş resursla işləmək bacarığı (onun strukturunu və naviqasiya üsullarını tez başa düşmək bacarığı). Axtarış indeksləri axtarış sürətini təmin etmək üçün kifayət deyil. Onlara əlavə olaraq, İnternetdə bir sıra axtarış resursları mövcuddur ki, onların istifadəsi peşəkar axtarışın aparılmasını təmin edir.
Etibarlılıq. İnternetdən alınan məlumatların etibarlılığı məsələsi çox aktualdır, çünki hər kəs istənilən məlumatı onun reallığa uyğunluğuna nəzarət etmədən orada yerləşdirə bilər. Bu da öz növbəsində interneti dolduran esse və kurs işi kimi çoxlu sayda etibarsız mənbələrə gətirib çıxarır.
İnternetdə məlumat mənbəyinin etibarlılığını qiymətləndirməyə imkan verən xüsusi axtarış xidmətləri var.
Tamlıq. Uğurlu tammiqyaslı məlumat toplanması üçün zəruri şərt bu gün mövcud olan əsas resurslar növlərini bilmək və müxtəlif axtarış xidmətlərindən istifadə etməkdir. Heç bir axtarış sistemi bütün internet resurslarını əhatə edə bilməz.
Bir qayda olaraq, müsbət nəticə əldə etmək üçün istifadəçi bir neçə axtarış sisteminin xidmətlərinə müraciət etməlidir. Sistemdən sistemə keçərək bunu özünüz edə bilərsiniz və ya bu işi meta-axtarış sistemlərindən birinə həvalə edə bilərsiniz (meta mürəkkəb sözlərin ilk komponentidir, digər sistemləri təsvir etmək və araşdırmaq üçün sistemləri ifadə edir).
düyü. 3.4. Meta axtarış mühərriki pəncərələri
Meta axtarış sistemlərinin öz axtarış verilənlər bazası yoxdur və axtarış zamanı bir çox başqa axtarış sistemlərinin resurslarından istifadə edirlər. Bunun sayəsində lazımi məlumatların tapılma ehtimalı çox yüksəkdir. Meta axtarış sistemlərində iş axtarış sistemlərində işlədiyi kimi eyni qaydalara uyğun aparılır. Bunun səbəbi meta-axtarış sistemlərinin axtarış sistemlərinə bir növ əlavə olması və onların indeks verilənlər bazalarından öz işlərində istifadə etməsidir. Meta axtarış sistemlərinin görünüşü məşhur axtarış sistemlərinin görünüşünə bənzəyir. Şəkildə. 3.4 myweb.ru və metabot.ru meta axtarış sistemlərinin pəncərələrini göstərir.
Təcrübə göstərir ki, əksər hallarda bir meta-axtarış motorundan istifadə etməklə müqayisədə bir neçə müstəqil axtarış indeksindən istifadə etməklə daha yaxşı nəticələr əldə edilir.
Test sualları və tapşırıqlar
1. Brauzer proqramının məqsədi nədir?
2. Hansı brauzer proqramlarını bilirsiniz?
3. Veb axtarışçısı URL-ləri harada tapa bilər?
4. Axtarış sisteminin rubrikatorundan istifadə edərək axtarışın texnologiyası nədir?
5. Açar sözlərlə axtarış texnologiyası hansıdır?
6. İnternetdə peşəkar şəkildə informasiya axtararkən hansı tələblərə əməl edilməlidir?
7. Axtarış meyarlarında “+” və ya “-” işarələri nə vaxt göstərilməlidir?
8. Yandex-də hansı axtarış meyarları aşağıdakı ifadə ilə müəyyən edilir:
(dayə | müəllim | idarəçi) ++ (qayğı | təhsil | nəzarət).
9. Mürəkkəb sorğu formalaşdırarkən işarənin ikiqat artırılması (∼∼ və ya ++) nə deməkdir?
10. Axtarışın uyğunluğu nədir?
11. Meta axtarış sistemlərinin məqsədi nədir?
Mühazirə 3
Veb texnologiyası World Wide Web (WWW) sənədlərin hazırlanması və İnternetdə yerləşdirilməsi üçün xüsusi texnologiya hesab olunur. WWW-ə veb səhifələr, elektron kitabxanalar, kataloqlar və hətta virtual muzeylər daxildir! Lazım olan məlumatı tapmaq üçün onun ünvanını tapmaq lazımdır. Bu məqsədlə ixtisaslaşmış axtarış serverləri (indeks robotları (axtarış sistemləri), tematik internet kataloqları, meta-axtarış sistemləri, insanların axtarışı xidmətləri və s.) mövcuddur.
İnternetdə məlumat axtarışı sorğuları emal edən xüsusi proqramlardan istifadə etməklə həyata keçirilir - məlumat axtarış sistemləri (IRS). Axtarış motorlarının işinin əsaslandığı bir neçə model var, lakin tarixən iki model ən böyük populyarlıq qazanmışdır - bu axtarış kataloqları və axtarış indeksləri.
Axtarış kataloqları böyük kitabxanaların mövzu kataloqları ilə eyni prinsip əsasında təşkil edilir. Onlar adətən ünvanları bu kataloqda olan saytların mövzularını müəyyən edən, mövzunun səviyyədən səviyyəyə tədricən aydınlaşdırılması ilə elementləri və alt elementləri olan iyerarxik hipermətn menyularıdır. Axtarış qovluqları əl ilə yaradılır. Yüksək ixtisaslı redaktorlar WWW informasiya məkanını şəxsən nəzərdən keçirir, ictimai maraq kəsb edənləri seçir və onu kataloqa daxil edir.
Axtarış qovluqlarının əsas problemi WWW resurslarının həddən artıq aşağı əhatə olunmasıdır. Veb-resursların əhatə dairəsini əhəmiyyətli dərəcədə artırmaq üçün axtarış sisteminin məlumat bazasının doldurulması prosesindən insan amili aradan qaldırılmalıdır - iş avtomatlaşdırılmalıdır.
Veb resurslarının avtomatik kataloqlaşdırılması və müştərilərin istəklərinin təmin edilməsi həyata keçirilir axtarış indeksləri. Axtarış indeksinin işini üç mərhələyə bölmək olar:
· ilkin verilənlər bazasının toplanması. WWW informasiya məkanını skan etmək üçün xüsusi agent proqramlarından - qurdlardan istifadə olunur, onların vəzifəsi naməlum resursları axtarmaq və verilənlər bazasında qeydiyyatdan keçirməkdir;
· verilənlər bazasının indeksləşdirilməsi - axtarışın optimallaşdırılması məqsədilə ilkin emal. İndeksləşdirmə mərhələsində ixtisaslaşdırılmış sənədlər yaradılır - faktiki axtarış indeksləri;
· nəticədə siyahının dəqiqləşdirilməsi. Bu mərhələdə, nəticədə istifadəçiyə ötürüləcək keçidlərin siyahısı yaradılır. Nəticə siyahının dəqiqləşdirilməsi axtarış nəticələrinin süzülməsini və sıralanmasını əhatə edir.
Filtrləmə istifadəçiyə təqdim etmək üçün uyğun olmayan keçidlərin filtrlənməsi deməkdir (məsələn, dublikatların yoxlanılması). Reytinq əldə edilən siyahının (açar sözlərin, əlaqəli sözlərin və s. sayına görə) təqdim edilməsi üçün xüsusi sifarişin yaradılmasından ibarətdir.
İstənilən informasiya sisteminin əsas vəzifəsi istifadəçinin informasiya ehtiyaclarına uyğun məlumat axtarmaqdır. Axtarış nəticəsində heç nə itirməmək, yəni sorğu ilə bağlı bütün sənədləri tapmaq və artıq bir şey tapmamaq çox vacibdir. Buna görə də, axtarış prosedurunun keyfiyyət xarakteristikası təqdim olunur - aktuallıq.
Uyğunluq axtarış nəticələrinin tərtib edilmiş sorğuya uyğunluğudur.
Federal Təhsil Agentliyi
Smolensk Dövlət Universiteti
İnternetdə məlumat axtarmaq texnologiyaları.
Smolensk
Giriş……………………………………………………………………………………….. 1. Axtarış sistemlərinin təsnifatı …………………………………………. 2.Axtarış üsulları……………………………………………………………… 2.1.Sadə axtarış……………………………………………………………… 2.2. Qabaqcıl axtarış……………………………………………………. 3.Yahoo Mövzu Kataloq…………………………………………… 4.Avtomatik indeks Alta Vista………………………………………………………… 5.Konfranslarda məlumat axtarışı (Usenet)…………………………….. 6. Daxili axtarış xidmətləri ……………………………………….. 6.1.Rambler……………………………………………………………………. 7. Faylları axtarın………………………………………………………………………………… 8. Xüsusi məlumat mənbələri……………………………… 9. İnternetdə ayrı-ayrı şəxslərin axtarışı…………………………………… 10.Metaaxtarış………………………………………………………………….. 11.Effektiv məlumat axtarışı…………………………………………… Nəticə………………………………………………………………….Ədəbiyyat………………………………………………………………….. |
Giriş
İnternetdə ehtiyac duyduğu məlumatı tapmağa cəhd edən hər kəs yəqin ki, bu prosesin ot tayasında iynə tapmaq kimi olduğu ilə razılaşar. Qlobal İnternetdə hər gün sürətlə artan çoxlu məlumat var. Buna görə də tez-tez belə çıxır ki, bu məlumat okeanında lazımi məlumatı tapmaq vəzifəsi olduqca çətindir və müxtəlif axtarış sistemlərindən (İnternetdə məlumat axtarmaq üçün proqramlar) səmərəli istifadə etməyi bacarmaq lazımdır. Nəzərə almaq lazımdır ki, “Axtarış sənətdir”.
1. Axtarış sistemlərinin təsnifatı
Fərqli şirkətlərə məxsus bir çox müxtəlif axtarış motorları var. Əvvəla, sözdə tematik kataloqlar (məsələn, Yahoo) və avtomatik indekslər (məsələn, AltaVista) var, baxmayaraq ki, bir sıra axtarış motorlarının bu iki "qütb" arasında aralıq mövqe tutduğunu nəzərə almaq lazımdır. , yəni onlar bu siniflərin hər iki elementini ehtiva edir. Axtarış sistemlərinin hər birinin müxtəlif Veb sənədlərinin ünvanlarının (yerlərinin) özünəməxsus geniş məlumat bazası var və bizə lazım olan məlumatlara keçidlərin axtarışı Veb sənədlərin özündə deyil, bu verilənlər bazasında baş verir.
Tematik kataloqlar və avtomatik indekslər, ilk növbədə, məlumat bazalarının necə formalaşması və doldurulması ilə fərqlənir: insanlar bu prosesdə iştirak edir, yoxsa hər şey tamamilə avtomatik baş verir.
Tematik kataloqların məlumat bazaları xüsusi axtarış proqramları vasitəsilə internetdə aşkar edilmiş yeni Veb sənədlər əsasında müvafiq sahələr üzrə mütəxəssislər tərəfindən tərtib edilir və sistemli şəkildə yenilənir. Tematik kataloq İnternet istifadəçisinə kateqoriyaların (bölmələr və yarımbölmələrin) ağaca bənzər müəyyən strukturunu təqdim edir, onun yuxarı səviyyəsində Elm, İncəsənət, Biznes və s. kimi ən ümumi anlayışlar və elementlər toplanır. ən aşağı səviyyə ayrı-ayrı Veb səhifələrə və serverlərə keçidlər və onların məzmununun qısa təsviridir. Siz bu iyerarxik kataloqda daha ümumi kateqoriyalardan (anlayışlardan) başlayaraq daha dar, ixtisaslaşdırılmış kateqoriyalara qədər gedə bilərsiniz.
Məsələn, superstring nəzəriyyəsi üzrə tədqiqatın vəziyyəti haqqında məlumat tapmaq üçün aşağıdakı konsepsiyaların "nərdivanı" ilə enə bilərsiniz:
Elm
Fizika (Fizika)
Nəzəri fizika
Nəzəriyyələr
Sim nəzəriyyələri
Nəticə, Superstrings saytının ən çox maraq göstərdiyi saytların siyahısı olacaq. Superstrings hiperlinkinə klikləməklə, biz saytın müvafiq başlığı ilə əsas səhifəsinə keçirik, burada superstring nəzəriyyəsi üzrə onlayn dərslik, əlavə oxumaq üçün müxtəlif keçidlər, superstrings haqqında lüğət və s.
Tematik kataloqların əsas üstünlüyü istifadəçi tərəfindən alınan məlumatın böyük dəyəridir ki, bu da yeni veb-səhifələrin təhlili və çeşidlənməsi prosesində “insan amilinin” olması ilə təmin edilir. Digər tərəfdən, tematik kataloqlar yenə də insan amili ilə əlaqəli əhəmiyyətli çatışmazlığa malikdir, çünki məhdud insan imkanları səbəbindən onların məlumat bazaları bütün Veb informasiya məkanının yalnız kiçik bir hissəsini (1% -dən az) əhatə edir. Beləliklə, tematik kataloqların bütün faydalılığına baxmayaraq, yalnız bu tip axtarış sistemlərinin istifadəsi çox vaxt açıq-aşkar qeyri-kafi olur.
Seçilmiş mövzu kataloqlarının xülasə cədvəli
List.Ru | Aport | Yandex | Rambler | Yahoo! | Haqqında | |
ümumi xüsusiyyətlər | 19 yüksək səviyyəli bölmə | 14 yüksək səviyyəli bölmələr | 10 əsas bölmə, 7 birləşdirilmiş, əlavə təsnifat | 56 bölmə | 14 əsas bölmə | 36 bölmə |
Bölmə daxilində resursların çeşidlənməsi | Əlifba, bələdçi reytinqləri, populyarlıq (davamiyyət), tarix | Əlifba, davamiyyət, liqa, verilmiş mənbəyə keçidlərin sayının təxmini, istifadəçi rəyi | Əlifba, əlavə tarixi, sitat indeksi | iştirakla | əlifba sırası ilə | ödənişli bağlantılar vasitəsilə |
Boolean operatorları | Axtarış motorunun dili Aport-dur. | Yandex axtarış sisteminin dili istifadə olunur | Rambler axtarış motoru dili istifadə olunur | Yox | Yox | |
İfadə ilə axtarın | " " | " " | ||||
Prefikslər | +, - | +, - | ||||
İterativ axtarış (nəticələrdə) | Kateqoriya daxilində axtarış var | Daxil olduqdan sonra Ətraflı... üzərinə klikləyin. | ||||
sözün bir hissəsini əvəz etmək | * | * (həmişə düzgün deyil) |
Tematik qovluqlardan fərqli olaraq, avtomatik indekslər üçün verilənlər bazaları yeni yaranan Veb sənədlərin axtarışında gecə-gündüz İnternet qovşaqlarını (saytlarını) skan edən bəzi xüsusi daxili axtarış robot proqramları tərəfindən tamamilə avtomatik olaraq yaradılır və doldurulur. Hər bir belə sənəddən robot özündə olan bütün yeni keçidləri çıxarır və onları öz ünvanlar bazasına əlavə edir, nəticədə robot proqramı bir sıra yeni Veb sənədlərinə baxmaq imkanı əldə edir. Hər bir yeni Veb sənədində robot ona daxil olan bütün sözləri təhlil edir və verilənlər bazası bölməsində hər bir verilmiş sözə uyğun olaraq bu sözün tapıldığı sənədin ünvanı (URL) saxlanılır. Beləliklə, avtomatik indekslə yaradılmış verilənlər bazası əslində hansı Web sənədlərində müəyyən sözlərin olması haqqında məlumatları saxlayır. Mövzu kataloqlarından fərqli olaraq, avtomatik indekslər ümumi veb məkanının 25%-ni əhatə edir.
Avtomatik indeks istifadəçi interfeysini təmin etmək üçün ayrıca axtarış sisteminə malikdir. Bu sistem verilənlər bazasına baxaraq, verilmiş açar sözlər toplusundan istifadə edərək, istifadəçinin kompüter ekranında bu açar sözlər toplusunu ehtiva edən bütün Veb səhifələr haqqında ünvanları və qısa məlumatı tapıb göstərə bilər. Beləliklə, avtomatik indeks üç hissədən ibarətdir: robot proqramı, robotun topladığı verilənlər bazası və həmin verilənlər bazasını axtarmaq üçün interfeys. İstifadəçinin işlədiyi sonuncu komponentdir. Bu təşkilata görə avtomatik indeks məlumatın heç bir təsnifatı və ya qiymətləndirilməsini həyata keçirmir.
Avtomatik indeks interfeysi istifadəçiyə onun nöqteyi-nəzərindən axtardığı sənədlər üçün xarakterik olan müəyyən açar sözlər toplusunu təyin etməyə imkan verir və bununla da ona kifayət qədər məhdud sayda potensial uyğun Web səhifələrini tapmağa imkan verir. Belə sözlər kimi bəzi konkret terminlər və onların birləşmələri, kifayət qədər nadir soyadlar və s.
Lazımi məlumatın tapılmasının müvəffəqiyyəti əsasən açar sözlərin uğurlu seçimi ilə müəyyən edilir, çünki əks halda axtarış sistemi əhəmiyyətsiz Veb sənədlərinə minlərlə və milyonlarla bağlantıları qaytara bilər.
Nəzərə almaq lazımdır ki, təcrübəsiz istifadəçini çoxlu müxtəlif sürprizlər gözləyir, bəzən anekdot vəziyyətlərə gətirib çıxarır.
Avtomatik indekslər üçün açar sözlər üzrə axtarış zəruri məlumatı tapmaq üçün yeganə vasitədirsə, tematik qovluqlarda (məsələn, Yahoo!-da) bu alət daxili kateqoriyalar sistemi (ağacı) ilə səyahət etməklə yanaşı, alternativ axtarış üsuludur.
Bəzi axtarış xidmətləri reytinq xidmətləridir. Onlar müştəriyə digər İnternet istifadəçiləri tərəfindən ən çox daxil olan bəzi keçidlərin hazır siyahısını təqdim edirlər. Xəbər, musiqi və s. kimi ictimai maraq doğuran mövzulara gəlincə, statistik üsulla əldə edilən bu cür tövsiyələr çox rahat və faydalıdır. Bu cür xidmətlər, xüsusən də Rambler məişət xidməti tərəfindən təmin edilir.
2. Axtarış texnikası
2.1. Sadə axtarış
Hər bir axtarış sistemi (SE) öz axtarış metodlarını təqdim edir və açar söz birləşmələrini qeyd etmək üçün öz xüsusi qaydalarına malikdir. Bununla belə, əksər axtarış motorları üçün eyni dərəcədə etibarlı olan ümumi elementlər var. Tipik olaraq, bütün axtarış motorları axtarılan sənəd üçün xarakterik olan açar sözlərdən istifadə edərək Veb sənədləri axtarmağa imkan verir. Bu cür sözləri seçmək çox vaxt qeyri-ciddi bir işdir.
Tipik olaraq, bir açar sözü göstərmək kifayət deyil və sonra onların uyğun birləşmələrini necə təyin etmək barədə sual yaranır. Məsələn, biz rusiyalı laureat haqqında məlumat almaq istəyirik Nobel mükafatı 2000 Jores Alferov. Axtarış sahəsində yalnız soyadın göstərilməsi
çoxlu sayda sənədlərin aşkarlanmasına gətirib çıxaracaq ki, onların əksəriyyəti bizim maraqlandığımız fiziklə heç bir əlaqəsi yoxdur. Axtarış sahəsində iki açar sözü qeyd etməklə
boşluq simvolu ilə ayrıldıqda, fərqli axtarış sistemlərinin bu xarakterə fərqli reaksiya verdiyini nəzərə almalıyıq. Əksər proqram sistemləri məkanı məntiqi operator "və ya" (OR) kimi qəbul edir (bunlara Yahoo, AltaVista və s. daxildir). Buna görə də, Zhorez Alferov sözlərinin birləşməsindən istifadə etməklə axtarış azalmayacaq, əksinə, axtarış motoru tərəfindən tapılan sənədlərin sayını artıracaq: ya Zhorez sözünün, ya da Alferov sözünün və ya bu sözlərin hər ikisinin olduğu bütün sənədlər birlikdə görünəcək, tapılacaq.
Belə hallarda, daha adekvat axtarış üçün, onlara daxil edilmiş simvolların dəqiq birləşməsini təyin edən dırnaq işarələri içərisində olan açar sözlərdən istifadə edə bilərsiniz:
"Zhorez Alferov".
Bununla birlikdə, bu sözlərin fərqli ardıcıllıqla birləşməsini ehtiva edən sənədlər tapılmayacaq (Alferov Zhorez), çünki dırnaq içərisində olan hər şey tək bir ifadədir və axtarış sistemi sənədləri bütün simvolların tamamilə dəqiq uyğunluğu üçün axtarır. bu ifadədən.
Yalnız bütün açar sözlərimizi eyni anda ehtiva edən veb səhifələri tapmaq üçün onların hər birinin qarşısında artı işarəsi qoymalısınız. Misal üçün,
Zhorez +Alferov
həm Zhorez sözünün, həm də Alferov sözünün yalnız hər hansı bir ardıcıllıqla deyil, həm də bir-birindən istənilən məsafədə mütləq mövcud olduğu Web sənədlərinin tapılmasına gətirib çıxaracaq (sonuncu halda, tapılan sənəd arasında məntiqi əlaqə olmaya bilər) bu sözlər).
Sözün qarşısındakı mənfi işarə onu ehtiva edən bütün sənədləri istisna edir və bu, bəzi hallarda çox faydalı ola bilər. Məsələn, tapmaq lazımdırsa müxtəlif əsərlər həndəsi, lakin dalğa optikasında deyilsə, onda aşağıdakı açar sözlərin birləşməsini təyin edə bilərsiniz
İşıq+optika-dalğa
Nəzərə almaq lazımdır ki, bir çox sözlərin kökü eyni ola bilər, lakin sonluqları fərqli ola bilər (məsələn, çoxluğu göstərən Ingilis dili, rus dilində bitən iş və s.). Bununla əlaqədar olaraq, bir çox axtarış motorları açar sözlər ardıcıllığı şəklində bir sorğu aldıqdan sonra onu normallaşdırırlar: bu sorğudan dörd simvoldan az olan bütün sözləri (məsələn, ingiliscə prepozisiya) rədd edir və həmçinin rədd edirlər. müxtəlif sonluqlar və şəkilçilər.
Məsələn, “həndəsi optikada işıq şüası...” ifadəsini ehtiva edən sənədi qaçırmamaq üçün axtarış sistemi yuxarıdakı sorğunu formaya endirə (normallaşdıra) bilər.
İşıq+optik*-dalğa* (1)
Burada ulduz (*) işarəsi müvafiq sözlərin kökündən sonra hər hansı simvol birləşməsini bildirir.
Bütün proqram sistemləri müştərinin sorğusunun belə ilkin işlənməsini həyata keçirmədiyi üçün sorğunu özünüz formada (1) təyin etməyiniz məsləhətdir, yəni göstərmək üçün “ulduz” simvolundan istifadə edin. mümkün varyasyonlar açar sözlərin sonları.
Açar sözlərdə böyük (böyük hərf) və kiçik hərflərdən (kiçik hərf) istifadə edərkən nəzərə alınmalı bəzi fərqlər var. Tipik olaraq, kiçik hərflərlə axtarış həm mətndə böyük hərf olduqda, həm də kiçik hərf olduqda uyğunluqları nəzərə alır. Açar sözlərin böyük hərflərlə yazılması sözün tam olaraq bu formada olduğu sənədləri axtarmaq deməkdir.
Açar sözləri yalnız Web-səhifələrin başlıqlarında axtarmaq çox faydalı ola bilər, çünki sənədin başlığının əhəmiyyəti adətən mətninin əhəmiyyətindən çox olur. Müxtəlif PS-lərdə açar sözlərin axtarışı yalnız Veb səhifələrin başlıqlarında müxtəlif xidmət sözlərindən istifadə etməklə müəyyən edilir: AltaVista-da bu başlıq sözüdür:, Yahoo! - t: Rambler-də - $ başlığı: və s.
2.2. Qabaqcıl Axtarış
Sadə axtarış üsulları həmişə bizə lazım olan Veb sənədləri kifayət qədər səmərəliliklə tapmağa imkan vermir və buna görə də axtarış sistemləri müştəriyə qabaqcıl axtarış vasitələrindən istifadə etmək imkanı verir. Qabaqcıl axtarış üçün sorğular məntiqi əməliyyatlar işarələri ilə əlaqəli açar sözlərdən qurulur və proqramlaşdırma dillərində istifadə olunan Boolean ifadələrinə bənzər bir forma malikdir.
Standart məntiqi əməliyyatlar OR ("və ya"), AND ("və") və NOT (inkar) ilə yanaşı, açar sözlərin bir-birinə yaxınlıq dərəcəsini təyin edən NEAR əməliyyatı istifadə olunur (və çox effektivdir!) Veb sənədində.
Mürəkkəb sorğuları yerinə yetirərkən, yuxarıda göstərilən əməliyyatların yerinə yetirilmə ardıcıllığını, yəni onların prioritetinin nə olduğunu başa düşmək vacibdir. OR, AND, NOT, NEAR ardıcıllığında əməliyyatların prioriteti soldan sağa artır. Mürəkkəb sorğunun ayrı-ayrı elementlərinin yerinə yetirilməsi qaydası proqramlaşdırmada Boolean ifadələrini yazarkən adət edildiyi kimi, mötərizələrdən istifadə etməklə dəyişdirilə bilər.
Sadə axtarış vasitələrindən fərqli olaraq, təkmil axtarış vasitələri müxtəlif axtarış sistemlərində daha çox standartlaşdırılıb. Qabaqcıl axtarışın böyük üstünlüyü həm də müştəriyə təklif edilən sorğuların qurulması variantlarının çevikliyidir və əhəmiyyətli çatışmazlıq sadə axtarışla müqayisədə onun xeyli yavaş işləməsidir.
OR (“və ya” operatoru) əksər axtarış sistemlərində sadə axtarış sorğularında boşluq simvolu ilə eyni funksiyanı yerinə yetirir. Məsələn, sorğu
ya söz kolu, söz rejimləri və ya hər ikisini ehtiva edən sənədləri axtarır.
VƏ ("və" əməliyyatı) bu əməliyyatla əlaqəli hər iki sözün mütləq tapıldığı sənədlərin tapılmasına gətirib çıxarır, lakin eyni zamanda bir-birindən istənilən məsafədə yerləşə bilər. Nəticədə sənəddə verilmiş iki açar söz arasında məntiqi əlaqənin olmadığı ortaya çıxa bilər. Məsələn, sorğuya cavab olaraq
AltaVista axtarış sistemi təkcə qeyri-xətti dinamika ilə bağlı müvafiq elmi əsərlərə deyil, həm də H. Uelsin məşhur elmi fantastika romanının “Dünyaların mübarizəsi”nin ayrı-ayrı fəsillərinə keçidlər təqdim edir ki, bu da təbii ki, bu mövzu ilə heç bir əlaqəsi yoxdur. axtarışın mövzusu.
DEYİL, sizə lazımsız ifadəni ehtiva edən veb sənədləri istisna etməyə imkan verən inkar əməliyyatıdır (beləliklə, bu əməliyyat mürəkkəb axtarışda sadə axtarışda mənfi işarə ilə eyni rol oynayır).
NEAR (açar sözlərin bir-birinə nə qədər yaxın olduğunu göstərən Boole əməliyyatı) ən əlverişli təkmil axtarış əmrlərindən biridir. Müxtəlif axtarış sistemlərində söz yaxınlığı ilə bağlı fərqli anlayışlar var. Məsələn, AltaVista bir-birindən on sözdən çox olmayan sözləri yaxın hesab edir. Bəzi digər proqram sistemləri NEAR əməliyyatını yazarkən yaxınlıq dərəcəsini açıq şəkildə göstərməyə imkan verir, yəni bu əməliyyatla əlaqəli iki açar söz arasında görünə bilən kənar sözlərin maksimum icazə verilən sayını təyin etməyə imkan verir.
Sorğu növü
göstərilən iki açar sözün bir-birinə kifayət qədər yaxın olduğu və buna görə də çox güman ki, məna baxımından əlaqəli olduğu sənədləri axtaracaq. Məsələn, Web-səhifənin mətnində “Normal rejimlərin kolları..” ifadəsi ola bilər.
Alferovun YAXINLIĞINDA Zhores
Jores İvanoviç Alferov, Alferov Jores İvanoviç və s. ifadələri ehtiva edən sənədlərin axtarışına səbəb olacaq. Qeyd edək ki, NEAR əməliyyatından istifadə edərkən sənəddəki açar sözlərin sırasını müəyyən etmək olmur, lakin bu, çatışmazlıq deyil, lakin üstünlükdür və bu, indi verilmiş sorğudan aydın görünür.
Artıq qeyd edildiyi kimi, yuxarıda təsvir edilən məntiqi əməliyyatlardan istifadə edərək, mürəkkəb məntiqi ifadə şəklində axtarış sorğusunu təyin edə bilərsiniz.
Bəzilərinin olmasına baxmayaraq ümumi prinsiplər Veb sənədlərin axtarışını təşkil edərkən, müxtəlif proqram sistemləri müştəriyə verilən imkanlara, onların əsas səhifələrinin görünüşünə və s. internet.
Nümunə olaraq, aşağıda iki ən populyar PS Yahoo (tematik kataloq) və AltaVista (avtomatik indeks) çox qısa, sxematik təsviri verilmişdir.
3. Yahoo Subject Directory
Bu sistem internetdə ilk yaranan sistemlərdən biri olub və bu gün Yahoo bir çox informasiya axtarış alətləri istehsalçıları ilə əməkdaşlıq edir və onun müxtəlif serverlərində müxtəlif proqram təminatı istifadə olunur. Siz http://www.yahoo.com ünvanından istifadə edərək Yahoo axtarış sisteminə daxil ola bilərsiniz.
Nəzərə alın ki, brauzerlər adətən ünvanın natamam yazılmasına icazə verir. Məsələn, Yahoo-ya zəng etmək üçün ünvan sahəsinə yalnız Yahoo sözünü yaza bilərsiniz və ünvanın qalan hissəsi avtomatik olaraq brauzer tərəfindən əlavə edilir.
Yahoo ana səhifəsi müştəriyə bu axtarış sistemi ilə işləməyin iki əsas üsuluna daxil olmaq imkanı verir - açar sözlərdən istifadə edərək veb sənədləri axtarmaq, onların dəsti "Axtarış" düyməsinin solunda yerləşir və iyerarxik axtarışdan istifadə edərək axtarış. aşağıda yerləşən müxtəlif bölmələrin (kateqoriyaların) ağacı.
Nəzərə alın ki, hər iki halda istədiyiniz Veb-sənədin keçidinin axtarışı eyni verilənlər bazasında baş verir, lakin müxtəlif üsullarla.
Maraqlanan tematik kataloqun adının üzərinə klikləməklə bölməni açdıqdan sonra əsas səhifə ilə tamamilə eyni quruluşa malik yeni Yahoo səhifəsini görəcəyik: burada açar söz axtarışı sahəsi və biz bölmənin alt bölmələrinin siyahısı var. seçmişlər və s.
Yahoo ana səhifəsində siz həmçinin reklamları, müxtəlif əlavə kateqoriyaları, məsələn, xəbərləri, xüsusən də hava haqqında məlumatları və s. görə bilərsiniz.
Yahoo tərəfindən tapılan bağlantıların ümumi sayı kifayət qədər böyükdürsə, bu bağlantıların siyahısı hissələrə bölünür. Varsayılan olaraq, bu hissədə 20 keçid var, lakin bu nömrəni başlatma düyməsi "Axtarış" axtarış düyməsinin yanında yerləşən axtarış seçimləri səhifəsinə daxil olaraq dəyişdirilə bilər. Orada siz həmçinin açar sözlər arasındakı boşluğun rolunu yenidən təyin edə bilərsiniz (istər məntiqi YA əməliyyatı, istərsə də məntiqi AND əməliyyatı hesab olunur) və s.
Seçimlər səhifəsində bütün söz axtarışı rejimini yandırmağa və ya söndürməyə imkan verən keçid də var. Alt sətirlər rejimində Yahoo qeyd etdiyimiz sözün təkcə öz-özünə deyil, həm də başqa sözlərin bir hissəsi olduğu bütün keçidləri tapacaq, məsələn, “sənət” sözünün axtarışı “şöbə” sözündə də işləyəcək ( şöbə, şöbə və s.) .d.). Varsayılan olaraq, Alt sətirlər rejimi elə qurulmuşdur ki, istifadəçi tək və cəm şəklində (yəni “-s” sonluğu ilə) və s. hər bir ismi daxil etməyə məcbur olmasın. Əksinə, Tam Sözlər rejimi bizdə olanları ehtiva edir. sifarişli açar sözlər yalnız hər iki tərəfdən boşluq və ya durğu işarələri ilə ayrıldıqda.
Yahoo-nun axtarış sistemi bir neçə müxtəlif verilənlər bazasında, ilk növbədə kateqoriya adları və Veb sayt başlıqlarında sorğuya uyğun gələn sənədlərə keçid axtarır. Əgər bu şəkildə lazımi keçidlər tapılmazsa, Yahoo avtomatik olaraq ayrı-ayrı veb səhifələrin verilənlər bazasında axtarış aparır. Müştəri açar söz giriş sahəsinin altında yerləşən düymələrə klikləməklə bu verilənlər bazalarından birində axtarış sifariş edə bilər. Yahoo PS axtarış nəticələri verilmiş linkin reytinqini müəyyən edən bir neçə meyar əsasında təşkil edilir. Açar sözlərin daha çox dəfə göründüyü, başlıqda göründüyü və ya keçid kateqoriya iyerarxiyasında daha yüksək bölməyə uyğun gələn sənədlərə daha yüksək reytinq verilir.
Axtarış nəticələri səhifəsinin sonunda Yahoo müştərini bu axtarışın nəticələrindən qane etmədiyi təqdirdə bir neçə başqa axtarış motorundan istifadə etməyi təklif edir. Bu cür bağlantılar rahatdır, çünki Yahoo sistemi onlara daxil olduqda açar sözlərimizi bu şəkildə adlandırılan başqa bir axtarış sisteminin sorğu formasına daxil edəcəkdir. Nəticə olaraq qeyd edək ki, Yahoo Veb səhifələrə bir milyona yaxın keçid təmin edir və bu, bütün Veb məkanının 0,1%-dən bir qədər çoxunu təşkil edir.
4. Alta Vista Auto Index
Bu axtarış sisteminə aşağıdakı ünvandan daxil olmaq olar: http://altavista.digital.com (bir çox brauzerlər üçün yalnız altavista sözünü yazmalısınız).
Alta Vista avtomatik indeks sinifində ən böyük verilənlər bazalarından birinə malikdir və ən güclü və çevik qaydalar tikinti sorğuları. Eyni zamanda, Alta Vista həm sadə axtarış sisteminə, həm də təkmil axtarış sisteminə malikdir, düyməsi açar söz giriş sahəsinin altında yerləşir.
Yahoo sisteminin kataloquna bənzər şəkildə təşkil edilmiş kateqoriyalar kataloqundan istifadə edərək məlumat axtarmaq mümkündür və açar sözlər üzrə axtarış yalnız müəyyən bir kateqoriya daxilində həyata keçirilə bilər.
Siz WWW səhifələri üçün verilənlər bazasında və ya xəbər qrupları verilənlər bazasında (Usenet) açar sözlərdən istifadə edərək Veb sənədləri axtara bilərsiniz. Bu verilənlər bazalarından birini seçmək üçün - WWW və ya Usenet məzmunu - əsas səhifəsində bu sistemin başlıq çubuğunun altında yerləşən düyməni istifadə edərək çağırıla bilən açılan siyahıdan istifadə edin.
Alta Vista-nın sadə axtarışından istifadə edərkən, onun müvafiq Yahoo axtarış alətindən fərqlərindən xəbərdar olmalısınız. Həqiqətən, standart olaraq Alta Vista, Yahoo-dan fərqli olaraq, bütöv sözlərin baş verməsini axtarır: sifarişli termin Veb sənədində tək dayanmalı və digər simvol sətirlərinin bir hissəsi olmamalıdır. Verilmiş açar sözün bütün təkrarlarını tapmaq lazımdırsa, hətta o, başqa sözlərin bir hissəsi olsa belə, * simvolundan istifadə etməlisiniz (bu simvol yalnız açar sözün sonunda görünə bilər və beş hərfi əvəz edə bilməz). Məsələn, Ada* formasının sorğusu “Ada”, “Adam”, “Adagio” və s. sözləri olan sənədlərin tapılması ilə nəticələnəcək.
Alta Vista axtarış sistemi, əksər digər axtarış motorları kimi, müştəriyə bir sıra əlavə imkanlar təklif edir, xüsusən də o, yalnız göstərilən açar sözlərin yalnız hipermətn keçidlərində, sənəd başlıqlarında və onların URL-lərində göründüyü veb sənədləri tapmağa imkan verir. (bu, müəyyən ünvana malik serverdə yerləşən bütün Veb səhifələri tapmağa imkan verir) və s. Bunun üçün Alta Vista xüsusi əmrlərdən istifadə edir: Anchor, title və s. .
Təkmil axtarış forması sadə sorğu formasından iki sahənin olması ilə fərqlənir. Onlardan ikincisi - Nəticələrin Sıralama Kriteriyaları - sadə axtarış formasının daxiletmə sahəsinə tamamilə bənzəyir və siz orada eyni xüsusi ifadələrdən, sitatlardan və işarələrdən +, -, * istifadə edə bilərsiniz. Lakin burada bu sahə nəticələrin çeşidlənməsi qaydasını təyin etməklə yalnız köməkçi rol oynayır: Reytinq sahəsindən açar sözlər olan sənədlər siyahıda ilk olaraq görünəcək.
Faktiki axtarış üçün açar sözlər xanaların birincisinə - Seçim meyarlarına daxil edilməlidir. Bu sahədə sorğular NEAR, NOT, AND, OR əməliyyatlarından istifadə edərək əvvəllər təsvir etdiyimiz qaydalara uyğun qurulur. Bundan əlavə, axtarış formasının aşağı hissəsində bizi maraqlandıran sənədlərin yaradıldığı və ya dəyişdirildiyi vaxt müddətini təyin etməyə imkan verən tarixlərin daxil edilməsi sahəsi var.
Alta Vista-da rus dilində sənədlərin axtarışının xüsusiyyətlərinə gəlincə, qeyd edirik ki, Yahoo kataloqunda rus açar sözlərindən istifadə edərək sənədləri axtarmağın mənası yoxdur, çünki bu xidmətin əməkdaşları rus dilini bilmirlər.
5. Konfranslarda məlumat axtarışı (Usenet)
WWW səhifələri ən böyük və ən qiymətli səhifədir, lakin İnternetdə yeganə məlumat mənbəyi deyil. Hər gün dünyanın hər yerindən 100 mindən çox mesajın dərc olunduğu Usenet xəbər qrupu sistemi böyük maraq doğurur.
Müştəri konkret mövzu ilə maraqlanırsa, o, sadəcə olaraq müvafiq xəbər qrupuna abunə ola bilər. Lakin o, problemini real insanlarla müzakirə etmək istəmirsə, sadəcə olaraq müəyyən bir məsələ ilə bağlı məlum olanı öyrənirsə, Usenet məzmununda avtomatik axtarış sistemlərindən istifadə edə bilər. Alta Vista, 10 mindən çox xəbər qrupunun ayrıca indeksini saxlayır, axtarış etmək üçün sadəcə axtarış keçidini "Veb" dəyərindən "Usenet" dəyərinə köçürmək lazımdır (sorğu yaratmaq və seçimləri təyin etmək üçün bütün qaydalar hər iki halda eynidir). Axtarış nəticələri məqalə başlıqlarının sıralanmış siyahısıdır, tam mətn hər hansı birinə onun başlığına klikləməklə daxil olmaq olar.
Bütün dünyada DejaNews serveri (http://www.dejanews.com) Usenet konfranslarında məlumat axtarmaq üçün ən yaxşı xidmət hesab olunur. Rusdillilər arasında RusNews serveri (http://news.corvis.ru) fərqlənir ki, bu da 2000-dən çox xəbər qrupunu özündə birləşdirən xəbər serveridir. Oxşar rus serveri TELA-search da var (http://tela.dux.ru/news.html).
Tamamilə unikal məlumat mənbəyi Tez-tez verilən suallara (FAQ) cavabları olan sənədlərdir. Bu sual və cavab janrı tamamilə hazır olmayan oxucunu məsələnin mahiyyəti ilə mükəmməl tanış edir. FAQ siyahıları əvvəlcə yalnız xəbər qrupları üçün mövcud olduğu halda, "FAQ" başlığı olan sənədlər indi müxtəlif server və xidmətlərin müştəriləri tərəfindən istifadə olunur. Məqalələr və rəylər bu janrda yazılır və firma və təşkilatlar öz məqsəd və istəklərini təbliğ edirlər. Müştərinin yeni elm, texnologiya, mədəniyyət və ya siyasət sahəsi ilə tez bir zamanda tanış olması lazımdırsa, müvafiq Usenet xəbər qrupunun FAQ bölməsini oxumaqla başlamaq məsləhətdir. Və bu şəkildə çox fundamental bilik əldə etmək mümkün olmasa da, terminologiyaya tez alışa, ən aktual problemlər haqqında öyrənə və tez-tez demək olar ki, tam istinad siyahısını əldə edə bilərsiniz.
6. Daxili axtarış xidmətləri
Rusiyanın İnternet sektoru hazırda sürətlə inkişaf edir və yerli axtarış sistemləri hələ də öz kataloqlarının və indekslərinin həcminə görə müvafiq xarici sistemlərdən geri qalmasına baxmayaraq, bəzi göstəricilərdə (ilk növbədə axtarış nəticələrinin emalı zamanı yeni texnologiyaların istifadəsi) xarici həmkarlarından geri qalır, bəzi hallarda hətta onları üstələyir.
İlk növbədə, Aport 2000 avtomatik indeksini və http://www.aport.ru/ və http://www.atrus.ru/ ünvanlarında yerləşən @Rus (Atrus) tematik kataloqunu qeyd edək. , müvafiq olaraq. Bu iki sistem ortaqdır. Həqiqətən, axtarış nəticəsində Aport 2000 müəyyən bir veb səhifənin ünvanını göstərdikdə, bu, @Rus kataloqundan götürülmüş müvafiq veb saytın qısa təsviri ilə müşayiət oluna bilər. Digər tərəfdən, Atrus kataloqunu doldurarkən Aport axtarış sistemindən fəal istifadə olunur. Müştərinin nöqteyi-nəzərindən, lakin bu axtarış sistemləri hələ də məlumat əldə etmək üçün müstəqil vasitələrdir. Onların bəzi üstünlüklərini qeyd edək. Aport 2000 verilmiş resursa aparan keçidlərin sayına (sitat indeksi) əsaslanan hal-hazırda ən effektiv reytinq sistemindən istifadə edir. Atrus axtarış sistemi müştəriyə rahat "Mənim @Rus" kataloq-portalını təqdim edir ki, bu da istifadəçinin ona ən çox ehtiyac duyduğu məlumatı tez bir zamanda əldə etmək üçün konfiqurasiya edə bilər. Bu kataloq üçün fərdiləşdirmə vasitələri, həmçinin axtarış sisteminin əsas səhifəsində lazımsız olan hər şeyi söndürməyə imkan verir ki, bu da onunla işləməyi xüsusilə sürətli və rahat edir.
6.1. Rambler ( http://www.rambler.ru )
Rambler axtarış sistemi Rusiyada ən böyük indekslərdən birinə malikdir, lakin o, əsas populyarlığını ilk növbədə reytinq sistemi kimi qazanmışdır. Bu, verilmiş mövzu haqqında məlumat verən veb-saytlar dairəsini tez müəyyən etməyə və son 24 saat ərzində müxtəlif İnternet müştəriləri tərəfindən ziyarətlərin sayına əsasən onların populyarlığını qiymətləndirməyə imkan verir. Müəyyən bir veb-sayta edilən ziyarətlərin sayı həmişə orada mövcud olan məlumatların həqiqi dəyərini göstərməsə də, ictimai maraq doğuran mövzularda belə bir populyarlıq reytinqinə etibar etmək olar.
Varsayılan olaraq, yalnız qeyd etdiyimiz bütün açar sözlərin tapıldığı sənədlər tapılır, yəni sözlər arasındakı boşluq məntiqi VƏ əməliyyatı kimi qəbul edilir. Bununla belə, bu boşluq dəyəri məntiqi OR əməliyyatına uyğun olaraq dəyişdirilə bilər (Yahoo və ya Alta Vista-da standart olduğu kimi). Bunu etmək üçün, inkişaf etmiş axtarış formasında "Sorğu sözləri: hər hansı" seçimini seçməlisiniz.
Müəyyən sözləri ehtiva edən sənədləri istisna etmək üçün sonuncu əlavə axtarış formasının müvafiq sahəsində göstərilməlidir.
6.2. Yandex ( http :// www . yandex . ru )
Yandex axtarış sistemi güclü təkmil axtarış vasitələri, eləcə də bir sıra texnoloji irəliləyişlər, məsələn, rus dili üçün xüsusilə vacib olan morfoloji sözlərin təhlili üçün intellektual mexanizmin olması ilə seçilir. Açar sözün sorğuda hansı formada yazılmasından asılı olmayaraq, Yandex onun bütün formalarını nəzərə alacaq. Məsələn, açar söz getdirsə, get, gedir və hətta getdi sözlərindən ibarət Veb sənədlərinə keçidlər var. Bununla belə, dəqiq söz forması ilə axtarış etmək olar, bunun üçün bu söz formasının qarşısına “!” nida işarəsi qoymaq lazımdır.
Sorğuda yazılan, boşluqlarla ayrılmış bir neçə söz onların hamısının axtarılan sənədin bir cümləsinə daxil edilməli olduğunu bildirir (yəni boşluq məntiqi VƏ əməliyyatı üçün işarə kimi çıxış edir).
Nəzərə almaq lazımdır ki, Yandex PS-də VƏ əməliyyatı açıq şəkildə “&” simvolu ilə göstərilə bilər (lakin VƏ sözündən istifadə etmədən). Bu simvolu ikiqat artırmaq, yəni “&&” simvolundan istifadə etmək AND əməliyyatının bütün sənədə genişlənməsinə gətirib çıxarır (yəni, && ilə əlaqəli sözlər mütləq bütün sənəddə olmalıdır). Sözügedən axtarış sistemində OR əməliyyatının simvolu “|” işarəsidir. (lakin OR sözünün özü deyil).
Yandex PS-də veb sənəddə göstərilən açar sözlərin bir-birindən yerləşdiyi məsafəni tənzimləyə bilərsiniz. Məsələn, sorğu
fiziki/(-2 4) təhsil
o deməkdir ki, fiziki söz təhsil sözünün ya solunda (ondan maksimum iki söz məsafəsində) və ya sağında (ondan maksimum dörd söz məsafəsində) ola bilər.
Yandex PS-ni yaradan CompTek şirkəti korporativ müştərilər (təşkilatlar) üçün veb saytın məzmununu indeksləşdirən Yandex.Site proqramının yüngül versiyasını pulsuz təqdim edir. Bu, öz saytlarında məlumat axtarmaq üçün yerli sistem təşkil etmək istəyən veb saytların sahibləri üçün əlverişlidir.
Yandex axtarış motorunun "Kömək" bölməsində çox yaxşı təsviri var, bu sistemdən istifadə etməzdən əvvəl ona baxmaq tövsiyə olunur.
7. Faylları axtarın
İnternetdə faylların axtarışı üçün xüsusi sistemlər arasında əvvəllər müzakirə edilmiş tematik kataloqların (məsələn, Yahoo) və avtomatik indekslərin (məsələn, Alta Vista) analoqları var. Təbii ki, bu axtarış sistemləri müştəriyə faylların özlərini deyil, yalnız onlara olan keçidlərin siyahısını təqdim edir.
Faylların axtarışı üçün mövzu kataloqları kimi ən populyar axtarış xidmətlərindən biri http://www.shareware.com ünvanında olan shareware.com-dur. Bu sistem faylları yalnız bir meyara görə təsnif edir: nə üçün əməliyyat sistemi onlar nəzərdə tutulmuşdur, lakin insanlar tərəfindən tərtib edilmiş bütün faylların təsvirlərini saxlayır. Shareware.com-un ana səhifəsi artıq nəzərdən keçirdiyimiz axtarış motorlarının səhifələrinə bənzər şəkildə qurulub. O, müştəriyə müxtəlif axtarış növləri təklif edir və açar sözlər istənilən simvol ardıcıllığına uyğun gələn * simvolunu ehtiva edə bilər. Axtarış həm fayl adlarında, həm də təsvirlərdə aparılır. Siz müəyyən bir tarixdə və ya ondan sonra yaradılmış fayllara keçidləri əldə etmək üçün axtarış üçün daha aşağı vaxt məhdudiyyəti təyin edə və nəticələrin tarixə və ya fayl adlarının əlifba sırasına görə çeşidlənməsini seçə bilərsiniz. Nəticələr siyahısında fayl adını klikləməklə, bu serverlərin etibarlılığını və kanalımızın bant genişliyindən asılı olaraq faylı yükləmək üçün tələb olunan vaxtı göstərən bu faylın surətlərini saxlayan İnternet saytlarına bir sıra keçidlər əldə edirik. .
Shareware.com qovluğundan fərqli olaraq, Archie axtarış sistemi Alta Vista-ya bənzər avtomatik indeksdir. İnsanlar Archie üçün anonim hostların siyahısını saxlamalıdırlar (onu http://hoohoo.ncsa.uiuc.edu/ftp/ saytında tapa bilərsiniz). Archie server verilənlər bazasında axtarış açar sözlərdən istifadə etməklə həyata keçirilir, bu halda onlar sadəcə olaraq fayl adları və ya adların fraqmentləridir.
Məşhur FTP saytlarına (məsələn, Windows proqramlarının zəngin kolleksiyası (ftp://ftp.winsite.com)) qoşulmaq üçün gecikmə kifayət qədər uzun ola bilər, buna görə də adətən onların dəqiq nüsxələri və ya “güzgüləri” var. İnternet " (güzgülər) və axtarış motorları bütün bu güzgülərin ünvanlarını verir.
Hamı üçün açıq olan faylları ehtiva edən kataloq demək olar ki, həmişə pub adlanır. Əksər arxivlərdə hər bir kataloqda həmin kataloqdakı hər bir faylın qısa təsviri, adətən bir sətirdən çox olmayan xüsusi fayl olur. Belə faylı 0index, 00index və s. adlandırmaq olar (faylın adına sıfırlar əlavə olunur ki, o, əlifba sırası ilə sıralanmış fayllar siyahısında həmişə birinci olsun).
8. İxtisaslaşdırılmış informasiya mənbələri
Elektron informasiya xidmətləri göstərən informasiya şirkətləri var. Məsələn, Knight-Ridder (KR) dünyanın ən böyük onlayn məlumat şirkətidir. ABŞ-dan DialogInformationService və Avropadan DataStar kimi dünyaca məşhur xidmətlər burada birləşib. İnternetdən xidmətlərini yaymaq üçün bir vasitə kimi istifadə etməklə, KR öz əməliyyatlarının əsas aspektlərini avtomatlaşdıra, müştəri xidmətlərini təkmilləşdirə və ən əsası xidmətlərin bazarını genişləndirə bildi. Bütün bunlar son nəticədə KR-nin elektron sənədlərin çatdırılması və məlumat xidmətlərində dünya lideri olmasına gətirib çıxardı.
IBM-in İnternetdə öz məlumat axtarış sistemi var - InfoMarket. O, məlumat və ödəniş idarəetmə alətlərini giriş hüquqları ilə birləşdirir.
Bununla belə, üzərində ilkin mərhələİnternet məkanının mənimsənilməsi müstəqil olaraq informasiya axtarışı olmadan həyata keçirilə bilməz. Burada veb saytların ünvanları və yaxşı qurulmuş biznes məlumat mənbələri çox faydalı ola bilər:
www.kentis.com KentInformationSystem şirkətinin serveridir, onun əməkdaşları mühasibat və maliyyə mütəxəssislərinə kompüter texnologiyalarından, xüsusən də İnternetdən istifadə etməyə kömək edir;
http://www.promotion.aha.ru - İnternetdə marketinq üzrə onlayn jurnal;
http://www.inter.net.ru - İnternet jurnalı, müntəzəm olaraq İnternetdə marketinq və reklam haqqında material dərc edir;
http://clickz.com tamamilə İnternet marketinq məsələlərinə həsr olunmuş jurnaldır.
9. İnternetdə ayrı-ayrı şəxsləri axtarın
Bir şəxs haqqında məlumat tapmaq ən asandır, əgər onun İnternetdə öz şəxsi ana səhifəsi varsa, adətən onun fotoşəkili, e-poçt və poçt ünvanı, telefon nömrəsi və s. qısa tərcümeyi-halı müəllif, hobbi və s. biri ən böyük sistemlərşəxsi səhifələri axtarmaq üçün Who’sWho adlanır və http://web.city.ac.uk/citylive/pages.html ünvanında yerləşir.
Elektron poçtdan (e-mail) istifadə edən müxtəlif insanların e-poçt ünvanlarının geniş kataloqları da mövcuddur. Buradakı liderlik, yəqin ki, http://www.four11.com saytındakı Four11 kataloquna aiddir.
Biz həmçinin səs oxşarlığı və ya soyadların yazılışı ilə (məsələn, “Kirsanov”, “Kirsanoff” və s.) axtarış edən WhoWhere kataloqunu (http://www.whowhere.com) qeyd edirik.
E-poçt ünvanlarının yerli kataloqu http://www.botik.ru/~intermap/form.html ünvanında yerləşir.
90 milyon ABŞ sakininin və 10 milyon Amerika şirkətinin hər hansı birinin koordinatlarını verən http://www.databaseamerica.com ünvanındakı bütün Amerika ünvan kataloqu tamamilə unikaldır.
10. Meta-axtarış
Müxtəlif axtarış sistemlərinin verilənlər bazası əhəmiyyətli dərəcədə üst-üstə düşmür. Buna görə də, kifayət qədər nadir məlumatları axtarmaq üçün bir deyil, bir neçə PS-ə müraciət etmək məsləhətdir. Bununla belə, müxtəlif PS-lər üçün sorğuların təqdim edilməsi qaydaları, ümumiyyətlə, bir-birindən fərqlənir. Fərqli axtarış sistemlərinə bir-bir müraciət etməmək və onların hər biri üçün sorğu formalaşdırmaq üçün xüsusi qaydalar barədə düşünməmək üçün meta axtarış sistemləri yaradıldı.
Müştərinin sifarişini qəbul edərək, dizaynı üçün öz qaydalarına uyğun olaraq açar sözlərdən istifadə edərək, meta-axtarış sistemi özü onu müxtəlif axtarış sistemlərinin formalarında qeydiyyatdan keçirəcək, bu formaları göndərəcək və cavab gözləyir. Bütün axtarış sistemləri öz axtarış nəticələrini qaytardıqdan sonra, meta-axtarış sistemi onları bir sənəddə toplayıb istifadəçiyə göndərəcək. Bu cür meta-axtarış sistemlərinə (http://metacrawler.cs.washington.edu:8080) ünvanında yerləşən MetaCrawler daxildir, bu da 9 müxtəlif axtarış motorlarına (o cümlədən: Yahoo, Alta Vista, Lycos, Excite və s.) sorğu göndərir. Fərqli axtarış sistemlərində eyni variantların müxtəlif şərhləri halında, MetaCrawler hətta axtarış nəticələrini yoxlamaq imkanı verir: istifadəçiyə keçid verməzdən əvvəl o, müstəqil olaraq sənədə baxacaq və onun sorğu şərtlərinə uyğun olub olmadığını yoxlayacaq - MetaCrawler kimi onları başa düşür. Əlbəttə ki, bu tarama rejimi nəticələrin alınmasını xeyli gecikdirir, lakin o, həm pozulmuş keçidlərdən, həm də mənasız nəticələrdən qoruyur. Qeyd edək ki, MetaCrawler sorğu formasında siz gözləmə müddəti təyin edə bilərsiniz: siyahıya yalnız bu anda müxtəlif axtarış sistemlərindən gəlməyi bacaran nəticələr daxil olacaq.
11. Effektiv məlumat axtarışı
Alətlərin əsas imkanlarını ətraflı öyrəndikdən sonra axtarışın səmərəliliyi probleminə müraciət edirik. Axtarış səmərəliliyinin əsas parametrləri bunlardır:
Tapılan sənədlərin sayının müvafiq sənədlərin ümumi sayına nisbəti kimi axtarışın tamlığı;
Axtarışın dəqiqliyi müvafiq sənədlərin sayının qəbul edilmiş sənədlərin ümumi sayına nisbətidir;
Sənədlərə keçidlərin aktuallığı - hazırda şəbəkədə aşkar edilmiş sənədlərin mövcudluğu;
Axtarış sürəti.
İnternetdə müxtəlif funksiyaları olan müxtəlif axtarış vasitələri var. Beləliklə, axtarışın keyfiyyəti ilk növbədə müəyyən bir axtarış sisteminin parametrlərindən, məsələn, indeksin ölçüsündən, axtarış metodundan (mövzuların aydınlaşdırılması və ya sorğu ilə axtarış) və s. Bundan sonra, müəyyən bir axtarış motoru ilə işləyərkən, sorğuların tərtib edilməsi üsulları haqqında təsəvvürünüz olmalı və lazımi operatorları bilməlisiniz.
Beləliklə, axtarışın səmərəliliyinə təsir edən aşağıdakı amillər müəyyən edilə bilər:
Axtarış sisteminin xüsusiyyətləri və imkanları;
İstifadəçinin sorğu tərtibinin keyfiyyəti.
İndi istifadəçini sorğu yaratmaq üçün ən yaxşı şəkildə necə hazırlamağa baxaq. İlk növbədə tapılmalı olan informasiyanın hərtərəfli leksik təhlilini aparmaq lazımdır. Sonra mövzu sahəsinə xas olan ayrı-ayrı terminlər və ifadələr şəklində açar sözlər toplusunu (lazım olduqda, bir neçə dildə) tərtib etmək məsləhətdir.
Tədbirlər:
Axtarış alətinin seçilməsi;
Bu axtarış aləti tərəfindən dəstəklənən operatorlardan istifadə edərək sorğuların dəqiq formalaşdırılması;
Test sorğularının göndərilməsi;
Axtarış nəticələrinin təhlili (linklərin sayına və uyğunluğuna görə);
Lazım gələrsə, sorğunu düzəldin;
Yenidən axtarış;
Yuxarıda göstərilənlərə əsaslanaraq, aşağıdakı effektiv axtarış üsullarını vurğulaya bilərik:
Məlumat axtarın general axtarış sistemlərində-kataloqlarda. - Axtarış sistemlərində yüksək ixtisaslaşmış məlumatları axtarın. Daha geniş bir axtarış aparmaq üçün yalnız məhdud sayda təsvir edilmiş resursları olan kataloq sistemlərindən istifadə etmək kifayət deyil. Bundan əlavə, kataloqlardakı yüksək ixtisaslaşmış məlumatlar sadəcə çatışmazlıq ola bilər. Ona görə də bu cür məlumatları böyük indekslərə malik axtarış sistemlərində axtarmaq lazımdır.
Axtarışınızı daraltmaq üçün operatorlar və ya təkmil sorğu formasından istifadə edin. Keyfiyyətli axtarış aparmaq üçün xüsusi axtarış sisteminin sorğu dili ilə tanış olmalısınız. Effektiv və sadə şəkildə Yüksək keyfiyyətli sorğu yaratmaq probleminin həlli təkmil axtarış rejimindən istifadə etməkdir.
Tapılmış resurslar arasında axtarış funksiyasından istifadə. Əksər axtarış motorları aldıqları nəticələr daxilində axtarış imkanını dəstəkləyir.
Meta axtarış motorlarından istifadə. Bu axtarış alətləri sorğunuzu eyni anda bir neçə axtarış motoruna göndərir və hər bir mühərrikdən bir neçə ən uyğun keçid alır.
Xəbər qruplarında suallara cavab axtarılır. İstəyirsinizsə, kömək üçün xüsusi bir sualla ixtisaslaşmış xəbər qrupu ilə əlaqə saxlaya bilərsiniz.
Xüsusi poçt siyahılarına abunə olun və s.
Nəticə
Sonda deyə bilərik ki, vahid optimal İnternet axtarış texnologiyası yoxdur. Lazım olan məlumatın xüsusiyyətlərindən asılı olaraq, onu tapmaq üçün müvafiq axtarış xidmətlərindən istifadə edilməlidir. Yadda saxlamaq lazımdır ki, axtarış xidmətləri nə qədər savadlı seçilsə və məlumat axtarışına müraciət edilsə, axtarış nəticələri bir o qədər yaxşı olacaqdır.
Ədəbiyyat
1. Kompüter Elmləri və İnformasiya Texnologiyaları / Ed. Romanova Yu.D. M.: Eksmo, 2008
2. Stepanov A.N. Kompyuter elmləri. Sankt-Peterburq: Peter, 2002
3. Mayechak B. İnternetdə məlumat axtarışı // 8 yaşdan 88 yaşa qədər uşaqlar üçün İnternet. M.: İnterekspert, 2002
4. Çeçin G. M., Polozhentsev E. V., Nizhnikova S. V. İnternetdə məlumat axtarın. Rostov-na-Donu: RSU, 2001.
5. Dikansky E.Yu. İnternetin mənimsənilməsi: təcrübəsiz istifadəçilər üçün informasiya və kommunikasiya texnologiyaları üzrə praktik kurs. M.: İlexa, 2001
6. http://www.dist-cons.ru/modules/searchinf/index.html
7. http://www.seonews.ru/masterclasses/detail/29812.php
8. http://www.gdenet.ru/bibl/technology/transmission/5.1.html