Понеділок, 29 листопада 2021

Будівництво

Моя хата небом крита, землею підбита, вітром загороджена

ІПС - це... Призначення та функції інформаційно-пошукових систем

Сучасній людині важко уявити собі життя без інтернету і практично миттєвого доступу до джерел інформації. Користувач рідко замислюється про те, як здійснюється пошук потрібного контенту в мережі. Адже це дуже цікаво.

Інформаційно-пошукова система (ІПС) - це складний програмно-апаратний комплекс, що здійснює відбір інформації за запитом користувача. Інформація зберігається на серверах у цифровому вигляді, як раніше стояли книги на полицях бібліотек. Система складається з безлічі підсистем. Кожна виконує своє завдання в процесі обробки запиту користувача та надання йому інформації в текстовому або звуковому вигляді. Множинністю вирішуваних завдань і обумовлена складність архітектури сучасних ІПС (абревіатура інформаційно-пошукової системи). Така собі "" чорна скринька "": на вході - текст запиту, що всередині - невідомо, на виході - вичерпна інформація.

Вхідні потоки

Запити на отримання інформації, які формує людина в текстовому вигляді на екрані свого гаджета, становлять малу частину оброблюваних пошуковою системою запитів. Основні масиви запитів для пошуку формують роботи, що приймають запит людини і здійснюють багатошаговий пошук і зворотний зв 'язок з користувачем. До інформаційно-пошукових систем належать відомі всім Google, "Яндекс" "та інші, що обробляють щодня мільйони запитів.

Початкові об 'єкти пошуку

Набором вихідних об 'єктів, що становлять інтерес для пошуку, є документи, записи, відеофільми, зображення та інше. Створюються вони поза ІПС. Загальна система зберігання та пошуку інформації повинна мати вбудовану бібліографічну систему - своєрідний каталог, що дозволяє здійснювати пошук будь-якого роду об 'єктів.

Об 'єкти або цифрові перетворення стають "ресурсом входу" в ІПС. Це серед них відбирають потрібну користувачеві інформацію.


Зовнішні джерела

У поданні вибору інформації використовуються зовнішні джерела знань. Це та інформація, яку шукає користувач. Назва фільму, цитата з книги та інше. Для комп 'ютерного пошуку цю інформацію необхідно перекласти в запит алгоритмічною мовою. В ІПС це здійснюється за допомогою блоку створення, індексування і розробки запитів.

В ідеалі ці три процеси - репрезентація, індексація і розробка запитів - потрібно спиратися на ідентичні джерела знань, але на практиці це недосяжно.

Необхідно постійно переглядати і оновлювати джерела знань, причому оновлення має бути ідентичним і синхронізованим. Та й зовнішнє джерело знань завжди хронологічно передує використанню його в пошукових системах для запиту, іноді на кілька років.

Перегляди

Перегляди вихідних об 'єктів складаються з вхідних даних у деяку комбінацію або перетворюються відповідно до правил та алгоритмів конкретної інформаційно-пошукової системи.

Перегляди - це більш-менш перетворені копії вихідного об 'єкта пошуку. У наборі невідредагованих повних текстів кожен текст є власним представленням. Об 'єкти музейних експонатів та артефактів можуть мати трансформований опис об' єкта з його зображенням. У деяких випадках подання може бути частково отримано з вихідного об 'єкта і частково з опису: у бібліографічних системах пошуку уявленнями є похідні від об 'єкта - наприклад, назва, ім' я автора буде поєднуватися з анотацією твору.

Індекс з можливістю пошуку

Оскільки інформація в інформаційно-пошукових системах зберігається у формі подання, логічно припускати, що пошук здійснюється за поданням і після відбору видається користувачеві. На практиці це не так. Наприклад, поточні каталоги мережевих бібліотек зазвичай обмежують пошук за кількома полями: автору, заголовку і підзаголовкам всередині вистави, що містить інші поля, за якими пошук не виконується. Це достатня причина, чому необхідно розрізняти подання та індекс з можливістю пошуку, який є пошуковою частиною подання. Він визначає все, що має бути доступно для пошуку. Індекс з можливістю пошуку, як подання та вихідний об 'єкт, може бути розділений на окремі субіндекси, щоб забезпечити більш точний, цільовий пошук

Пошукові системи звичайно мають всередині синтетичну структуру для зіставлення допустимих результатів пошуку. Ця структура є другим компонентом індексу з можливістю пошуку.


Процедурно процес індексації може бути реалізований по-різному: індекс, доступний для пошуку, може бути отриманий шляхом:

  • буквального копіювання вистави, доступного для пошуку;
  • шляхом копіювання деталей подання. Це може бути частина або всі уявлення, які існують фізично тільки у вигляді фрагментів, розподілених за правилами створення індексу для пошуку, який буде зібрано при необхідності.

Правила розробки запитів і формальні запити

Розробка запитів - це функція, яка є посередником між запитом користувача і формальним запитом. Вона перетворює запит користувача, узгоджуючи його зі словниками команд вилучення, специфікації індексу та індексом до вилучення. На зорі розвитку ІПС ця роль традиційно відводилася кваліфікованим IT-фахівцям.

Розробка комп 'ютерних запитів, які можуть співставляти запити зі словником в індекс системи з можливістю пошуку, зазвичай називається модулем "введення словника" ". Автоматизація цієї функції перспективна і пропонує можливості для експертних і ймовірнісних методів пошуку.

Формальний запит стає таким після перетворення запиту користувача. Приклади таких формальних перетворення включають усічення, підстановку, нормалізацію, векторизацію та інші перетворення "" зовнішнього "" подання на "" внутрішні "" подання комп 'ютерних ІПС (розшифровка - інформаційно-пошукова система).

Вилучені набори посилань на документи

Отриманий набір джерел інформації логічно є підмножиною подань, створений за правилами зіставлення, застосованого до формального запиту індексом з можливістю пошуку.

Зазвичай, але не обов 'язково існує окремий процес сортування відновленого набору інформації. Онлайн-каталоги бібліотек зазвичай перевпорядковують отримані набори в алфавітному порядку за автором перед відображенням. У системах пошуку інформації, які роблять суворе ранжування, ранговий порядок передує будь-якому переупорядкуванню.

Вихідні потоки

Виведення результатів пошуку здійснюється традиційно на дисплей, частіше у вигляді потоку об 'єктів, які будуть використовуватися в іншому місці або для деяких інших цілей, завершує основний цикл пошуку. Такі потоки можуть бути спрямовані на пристрої візуалізації, зберігання для подальшої обробки або використання як вхідних потоків в інші служби відбору.

Інформаційно-пошукові системи дозволяють здійснювати зворотний зв 'язок з виходом будь-якого процесу відбору. Вихідні дані будь-якого процесу можуть являти собою зворотний зв 'язок з іншими процесами. Зворотний зв 'язок може забезпечити основу для експертного судження на будь-якому етапі.


Найпопулярніше на сайті