14.3. Кәсіптік мақсатта іздеу жүйелері мен электрондық ресурстарды пайдалану
Іздеу жүйесі (engine) – searchit – ақпаратты іздеуге арналған компьютерлік жүйе.
Іздеу жүйелерінің ең танымал қолданбаларының бірі – дүниежүзілік желіде мәтіндік
немесе графикалық ақпаратты іздеуге арналған веб-қызметтері. Сондай-ақ ол
FTP-серверінде файлдарды, интернет-дүкендерден тауарларды, Usenet newsgroups
ақпаратын іздей алады.
Іздеу
жүйесін пайдаланып, ақпаратты іздеу үшін пайдаланушы іздеу сұрауын құрастырады.
Іздеу жүйесінің
жұмысы пайдаланушыны кілт сөзге қатысты кез келген жолмен кез келген белгілі
кілт сөздерді қамтитын құжаттарды табу үшін іздеу болып табылады. Бұл жағдайда
іздеу жүйесі іздеу нәтижесінің бетін жасайды. Мұндай іздеу тізімі веб-беттер,
суреттер, аудио файлдар сияқты нәтижелердің әртүрлі түрлерін қамтуы мүмкін.
Кейбір іздеу жүйелері де сәйкес дерекқордан және веб-каталогтан ақпаратты
шығарады.
Іздеу
нәтижелері алгоритмдердің сипатына немесе адам қателігіне байланысты маңыздырақ
болуы мүмкін. Әлемдегі ең танымал іздеу жүйесі – Google.
Зерттеу
және техникалық қызмет көрсету әдістеріне сәйкес іздеудің төрт түрі жалпы
сканерлерді, адам басқаратын жүйелерді, гибридті жүйені және метажүйені
пайдаланатын жүйелер болып табылады. Іздеу жүйесінің архитектурасы әдетте
мыналарды қамтиды:
-
интернет
сайттарынан немесе басқа құжаттардан ақпаратты жинайтын
браузер;
-
индекстеуіш,
сақталған ақпаратты жылдам іздеуді қамтамасыз етеді;
-
іздеу жүйесі –
пайдаланушыға арналған графикалық интерфейс.
Жыл
сайын Интернеттің көлемі айтарлықтай артады, сондықтан қажетті ақпаратты табу
ықтималдығы күрт артады, интернет миллиондаған компьютерлерді біріктіреді,
әртүрлі желілерде қолданушылар саны жыл сайын 15-80%-ға
артады.
Дегенмен,
интернетке кіру кезінде басты мәселе қажетті ақпараттың жоқтығында емес, оның
тез, әрі нақты ақпаратты дұрыс табу. Сондықтан
қажетті жауаптарды алу үшін қайда және қалай іздеу керектігін дұрыс және сауатты
түрде үйрену өте маңызды.
Интернеттің
негізгі ресурстарына (қызметтеріне) мыналар кіреді:
1)
World Wide Web (WWW);
2)
электрондық
пошта
(e-mail);
3) FTP файл
мұрағаты;
4) Интернет
желісіндегі байланыс.
Гипермәтін – бір
біріне сілтемелері бар жеке құжаттардың (беттердің) жиынтығы. Интернетте
деректерді берудің бірнеше әдістері (протоколдары) бар және ең танымал
гипермәтінді тасымалдау протоколы HTTP (Hyper Text Transfer Protocol) болып
табылады.
Гипермәтіндік
сілтеме – басқа құжатқа көшуді қамтамасыз ететін құжаттың таңдалған бөлігі болып
табылады. Мәтін, батырма
немесе суреттің асты сызылып тұрады.
E-mail
(электрондық пошта) – электрондық поштаға ақпаратты алмасудың
ресурсы.
FTP (File
Transfer Protocol) – файлдардың барлық түрлерін сақтау және тасымалдау
жүйесі.
IСО – интернет
желісі арқылы пейджингке ұқсас байланысты жүзеге асыратын
жүйе.
Ақпаратты іздеу
жүйелері
Барлық
іздеу жүйелерінде олардың орналасқан жері ортақ арнайы бөлінген қуатты
серверлерде және тиімді байланыс арналарына байланысты. Іздеу жүйелерін
ақпаратты іздеу жүйелері (АЗЖ) деп те атайды.
Іздеу
жүйелерінің түрлері:
1)
Іздеу роботтарын пайдаланатын жүйелер. Олар үш бөліктен
тұрады: тестер («бот», «робот», «өрмекші») индекс, іздеу жүйесінің бағдарламалық
құралы. Желіні тексеріп шығу және веб беттерді жасау үшін сканер қажет. Индекс
веб беттердің көшірмелерінің үлкен мұрағаты болып табылады. Бағдарламаның
мақсаты – іздеу нәтижелерін бағалау. Бұл механизмдегі іздеу роботы желіні үнемі
зерттейтіндіктен ақпарат өзектірек. Қазіргі заманғы іздеу жүйелерінің көпшілігі
осы типтегі жүйелер болып табылады.
2) Адамның
басқару жүйесі (каталог ресурстары). Бұл іздеу жүйелері веб беттердің тізімдерін
шығарып алады. Анықтамада сайттың мекенжайы, тақырыбы және қысқаша сипаттамасы
бар. Ресурс каталогы тек веб шеберлер жіберген бет сипаттамаларынан нәтижелерді
іздейді. Каталогтардың артықшылығы – барлық ресурстар қолмен тексеріледі,
сондықтан мазмұнның сапасы жүйенің бірінші түрімен автоматты түрде алынған
нәтижелермен салыстырғанда жақсырақ болады. Бірақ кемшілігі де бар – каталог
деректерін жаңарту қолмен жасалады және нақты жағдайдан айтарлықтай артта қалуы
мүмкін. Бет рейтингтері бірден өзгермейді. Мұндай жүйелердің мысалдарына Yahoo,
Dmoz және Galaxy каталогтары жатады.
3) Гибридті
жүйелер. Yahoo, Google, MSN сияқты іздеу жүйелері іздеу роботтары мен адам
басқаратын жүйелерді пайдаланатын жүйелердің функцияларын
біріктіреді.
4) Мета жүйелер.
Метаіздеу жүйелері бірден бірнеше іздеу жүйелерінің нәтижелерін біріктіреді және
дәрежелейді. Бұл іздеу жүйелері әрбір іздеу жүйесінің бірегей индексі болған
кезде және іздеу жүйелері азырақ «ақылды» болғанда пайдалы болды. Қазір іздеу
айтарлықтай жақсарғандықтан, оларға деген қажеттілік азайды. Мысалы, MetaCrawler және MSN
Search.
Әрбір ел кем
дегенде бір іздеу жүйесін құруға тырысады. Атап айтқанда, Қазақстанның өз іздеу
жүйелері бар: kaz.kz akumo.kz; google.kz; kaztube.kz және т.б.
Ең
танымал ақпараттық іздеу жүйелері:
Google –
америкалық трансұлттық корпорация. Америка
қоғамдық корпорациясына тиесілі кеңейтілген іздеу жүйесі. Танымалдығы бойынша
бірінші орында тұр (79.65 %), айына 41 млрд 345 млн сұраныс қабылдайды
(нарық бөлігі 62,4 % ), 25 миллиардтан астам веб беттерді индекстейді,
(2009 жылдың 15 қазанынан бастап) ақпараттарды 191 тілде іздеу мүмкіндігіне
ие.
Яндекс
(http://www.yandex.ru) – 1997 жылы жұмысын бастады. Оның құрамында 33 миллионнан
астам өнім бар және интернет-ресурстардың жеке каталогын жүргізеді. Сондай-ақ
иллюстрацияларды анықтауға арналған ең жақсы іздеу жүйесі. Ағылшын нұсқасы
Интернет ресурстарының анықтамалығымен жабдықталған. Сұраныстарды
қалыптастырудың кең жүйесі бар.
Rambler
(«wanderer», «tramp», «loitering person») – жаңалықтар агрегаторын қамтитын
медиа сервис интернет порталы, тақырыптық вертикалдар, тегін электрондық пошта
қызметі, іздеу жүйесі, жұлдыз жорамалдары және басқа да әртүрлі
қызметтер.