• Категория: Лингвистика
  • Вид работы: Дипломная работа
  • Год защиты: 2014
  • Оригинальность: 70 %

Оглавление
Введение. 2
Глава 1. Сущность и история создания поисковых систем.. 4
1.1 Определение понятия поисковая система. 4
1.2 История создания поисковых систем.. 13
1.3 Обзор современных поисковых систем.. 20
Глава 2. Анализ лингвистических составляющих функционирования поисковых систем.. 30
2.1 Определение параметров анализа. 30
2.2 Лингвистический анализ особенностей функционирования поисковых систем.. 30
2.3 Разработка предложений по совершенствованию деятельности поисковых систем.. 45
Заключение. 51
Список литературных источников. 53
Приложения. 53
 
Введение
Задачи информационного поиска являются предметом научных исследований уже несколько десятков лет.
Еще не так давно исследования в этой области относились к сфере научных интересов относительно узкой группы специалистов. Однако бурное развитие Интернет кардинально изменило ситуацию. Оно не только привлекло внимание к области информационного поиска, но также сильно расширило список рассматриваемых задач. Сегодня исследования в этой области посвящены не только вопросам индексирования и поиска в коллекции текстовых документов, но также и моделированию, задачам классификации и категоризации документов, архитектурам поисковых систем, вопросам визуализации данных и интерфейсам пользователя, языкам запросов и т.п.
В настоящее время Интернет является всемирным хранилищем информации практически по всем аспектам жизни человечества. Доступ к этой информации в связи с экспоненциальным ростом объема Интернет-ресурсов становится все более сложным и трудоемким с точки зрения поиска и анализа информации.
Поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас — это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.
Самой лучшей иностранной поисковой системой по последним данным является Google, так как основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система, будь то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться было бы не правильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками вводя в них нужные запросы. Из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.
Использование традиционной информационно-поисковой системы требует освоения некоего языка запросов, иногда достаточно специфичного для отдельной системы.
Кроме того, подобные системы не используют семантику обрабатываемых текстов. Этот недостаток не позволяет найти предложение, содержащее личное местоимение, являющееся перифразом для запроса и т.п. Ряд информационно-поисковых систем не учитывает даже синонимию. Все это снижает полноту результатов поиска.
Актуальность настоящей работы определяет поиск наиболее оптимальных лингвистических составляющих, участвующих в работе поисковых машин.
Объект исследования: Информационно-поисковые системы.
Предмет исследования: Лингвистический аспект анализа поисковых систем.
Цель исследования: Провести сравнительный анализ информационно-поисковых систем в сети интернет в  лингвистическом аспекте.
Задачи исследования:
1. Раскрыть исторические аспекты создания поисковых систем;
2. Проанализировать особенности современных поисковых систем.

  1. Провести анализ лингвистических составляющих функционирования поисковых систем.

Заключение

К настоящему времени четко выделились задачи, которые компьютеры пока не умеют решать хорошо. Одной из таких проблемных задач в области информационных технологий и искусственного интеллекта является задача по извлечению информации из текста или, в более широком смысле, задача понимания текста; к ним также можно отнести задачу распознавания образцов текста по смыслу или, более конкретно, задачу эффективного поиска.
Задача эффективного поиска или Интернет-поиска требует вовлечения контекста для ее решения. Если реализация семантического поиска — дело трудоемкое и требующее больших усилий по описанию каждой предметной области и каждого понятия и для описания присущих только этим понятиям характеристик, то использовать поиск с вовлечением контекста можно уже на уровне синтаксиса с грамматикой
Современные поисковые системы — это мощнейшие аппаратно-программные комплексы, целью которых является индексирование документов в сети интернет для выдачи данных по запросу пользователей. Для предоставления качественной и актуальной информации поисковым системам приходится постоянно совершенствовать свои формулы ранжирования. Обеспечение максимально высокого качества выдачи для пользователей и воспрепятствование манипуляциям с ней со стороны оптимизаторов — вот ключевые цели развития поисковых систем.
Во времена, когда поисковые системы только-только стали появляться на свет, их алгоритмы ранжирования были очень примитивны. Благодаря чему наиболее находчивые оптимизаторы стали продвигать свои сайты так, чтобы они появлялись в выдаче по интересующим их запросам. В результате это привело к тому, что ресурсы, которые зачастую не несли пользователю никакой полезной информации, становились первыми, тем самым отодвигая более полезные сайты на второй план.
В ответ на эти действия поисковые системы стали защищаться, совершенствуя свои алгоритмы ранжирования, вводя в формулы все новые переменные и учитывая все новые факторы. Со временем эта борьба оптимизаторов и поисковых систем перешла на новый уровень и поспособствовала появлению более совершенных алгоритмов, основанных, в том числе и на машинном обучении.
На наш взгляд поиск и поисковые сервисы и дальше будут развиваться в сторону быстрых и актуальных ответов на вопросы пользователей, предоставляя возможность получить всю необходимую информацию прямо в SERP (выдачу) и избавляя от необходимости переходить на другие сайты.
Существует мнение, что поисковые системы своим стремлением ответить на вопрос пользователя здесь и сейчас могут уничтожить поисковую оптимизацию, став этакими глобальными базами знаний. Но такие опасения беспочвенны, поскольку для того, чтобы стать глобальными базами знаний, им нужна информация, а её хранят те самые сайты, над которыми работают те самые оптимизаторы, которые причастны к тому, что поисковые системы не стоят на месте, а постоянно эволюционируют.


Список литературных источников

Книги и монографии
  1. Гусев, В.С. Google. Эффективный поиск – Москва: Диалектика, 2010г., 231с.
  2. Солтон Д. Динамические библиотечно-информационные системы – Москва: Мир 1979г., 112 с.
  3. Егоров, А.Б. Поиск в Интернете  - Санкт — Петербург.: НиТ, 2010г. 119с.
  4. Кузьмин А.В. Золотарева Н.Н. Поиск в Интернете — Санкт — Петербург.: Издательство НиТ, 2011г. 276с.
  5. Куприянова, Г.И., Информационные ресурсы Internet — М., 2012г. 321с.
  6. Рассел С. Интеллектуальные системы  – М.: Вильямс, 2007. – 1408 с.
  7. Экслер, А.Б. Самоучитель работы в Интернете — Москва.: NT Press, 2010г. 542с.
  8. AltaVista. http://www.altavista.digital.com. Digital Equipment Corporation, 1996г. 232с.
  9. Yuwono В., Lam L. World Wide Web Resource Discovery System – London. 1993, 349р.
  10. Browser Deals Push Netscape Stock Up 7.8%. Los Angeles Times. 1, №4, 1996г.
  11. Halasz F. G. Reflection notecards: seven issues for the next generation of hypermedia sys-tems. Communication of the acm, V31, N7, 1988, p.836-852
  12. Gandal  N. The dynamics of competition in the internet search engine market. International Journal of Industrial Organization 19 (7): р. 1103–1117
  13. Randolph Н.  The Extreme Searcher’s Handbook — London. 2003, 113 р.
  14. Bartschi М. An Overview of Information Retrieval Subjects. IEEE Computer, N5, 1985,p.67-84.
  15. Tim Berners-Lee. World Wide Web: Proposal for HyperText Project. 1990г. 223с.
 Интернет источники
  1. Аликберов А. И. Несколько слов о том, как работают роботы поисковых машин. [Электронный ресурс]: URL: http://www.citforum.ru/internet/search/art_1. shtm, свободный (дата обращения 01.02.2014г.)
  2. Описание зарубежных поисковых систем www.clx.ru. [Электронный ресурс]: URL: www.clx.ru, свободный (дата обращения 01.02.2014г.)
  3. Храмцов П. Е. «Поиск и навигация в Internet. [Электронный ресурс]: URL: http://www.osp.ru/cw/1996/20/31. htm, свободный (дата обращения 01.02.2014г.)
  4. How Do Web Search Engines Work. [Электронный ресурс]: URL: http://www.webopedia.com/DidYouKnow/Internet/HowWebSearchEnginesWork.asp. , свободный (дата обращения 01.02.2014г.)
  5. The American Heritage. New Dictionary of Cultural Literacy, Third Edition.[Электронныйресурс]:URL:http://dictionary.reference.com/browse/search+engine, свободный (датаобращения 01.02.2014г.)


Свяжитесь с нами в один клик:

Нажмите на иконку и вы будете переправлены на страницу связи с нашими специалистами.