СКРЫТЫЕ ВОЗМОЖНОСТИ GOOGLE 

 

Колесник Алла, Департамент информатики Молдавской Экономической Академии

За последние несколько лет появилось множество статей, которые предупреждают о том, что злоумышленники используют поисковую систему google для получения доступа к файлам, к которым, по идее, они доступа иметь не должны.

Базовая поисковая техника

Поскольку интерфейс Google совсем прост в использовании, сфокусируемся на некоторых доступных операторах поисковых запросов:

  • использование знака (+) для поиска наиболее общих слов, применение знака (-) для исключения термина из поиска (пробелы между знаками не допускаются)
  • чтобы найти фразу,простопомещаютеёвкавычки<>
  • знак <*> означает любое слово.

Операторы для более продвинутого поиска помогают поисковые результаты. Такие операторы имеют следующий синтаксис: (в этом выражении также не должно быть никаких пробелов). Примеры этих операторов:

  • site: инструктирует Google ограничить поиск конкретным web-сайтом (доменом); название сайта (домена) указывается сразу после двоеточия и без пробела
  • filetype: инструкция произвести поиск только в пределах текста указываемого типа файлов. Тип файла указывается после двоеточия (точку перед расширением файла указывать не нужно).
  • link: производить поиск внутри гиперссылок содержащих поисковый запрос
  • cash: оператор демонстрирует версию страницы, когда она индексировалась Google-ом. URL страницы указывается сразу после двоеточия
  • intitle: производить поиск внутри названия документа
  • inurl: искать внутри URL документа.

 

Техника Google хакинга

Использование основной техники поиска вместе с операторами продвинутого поиска Google позволит осуществить сбор информации и выявить существующие в сайте. Такие действия принято называть Google-хакингом.

 

Карта сайта

Чтобы выявить каждую страницу на сайте, Google сканирует его, используя оператор "site:". Рассмотрим запрос такого вида: site:http://www.microsoft.com microsoft. Этот запрос выполняет поиск по слову в пределах сайта http://www.microsoft.com. Как много страниц на сервере Microsoft содержат слово ? Согласно Google - ВСЕ ! Google исследует не только содержание страниц, но также их название и URL. Слово стоит в URL каждой страницы http://www.microsoft.com. Таким образом - единственным запросом хакер может инициировать обработку каждой страницы на сайте Microsoft, проиндексированной Google. Но есть исключения из этого правила. Если ссылка на странице Microsoft указывает обратно, на IP адрес сервера Microsoft, Google кэширует эту страницу как относящуюся к IP адресу, но не к серверу http://www.microsoft.com. В этом специальном случае хакер может изменить свой запрос, заменив слово просто IP адресом веб-сервера Microsoft.

 

Нахождение листинга директории

Листинг директории представляет собой список файлов и директорий удаленного сервера в окне браузера. Такие листинги открывают широкие возможности для углубленного сбора информации. Как правило, такие страницы директорий имеют в Title и теле страницы выражение . Отсюда очевидно и строение запроса для поиска таких листингов - это . В результате такого запроса будут найдены тонны страниц со словом в разделе Title документа.

К сожалению - этот запрос вернет слишком большое число страниц не по теме, к примеру, страницы вида:

  • Index of Native American Resources on the Internet
  • LibDex-Worldwide index of library catalogues
  • Iowa State Entomology Index of Internet Resources

Исходя из названий найденных документов, очевидно, что эти страницы не соответствуют заданному хакерскому запросу и вряд ли окажутся искомыми списками директорий.

Следующие запросы обеспечат более точные результаты:

  • intitle:index.of "parent directory"
  • intitle:index.of name size

Такие запросы более точно выдадут то, что нам нужно, поскольку ориентированы не только на фразу в Title страницы, но и на ключевые слова, всегда имеющиеся в листингах директорий: , , . Очевидно, что такой запрос можно комбинировать с другими, чтобы найти определенные файлы в списках директорий.

 

Определение версии WEB-сервера

Точная версия программного обеспечения web сервера - это один из элементов, необходимых хакеру для успешной атаки. Если хакер непосредственно соединится с сервером, то HTTP (web) заголовки (headers) этого сервера предоставят нужную ему информацию. Однако можно получить эту информацию из кэша Google безо всякого соединения с сервером. Такой метод основан на использовании как раз списка директорий.

Всё очень просто: список файлов директории включает имя серверного софта и его версию. Грамотный web администратор может фальсифицировать эту информацию, но это часто она реальна, поэтому хакер беспрепятственно может, получив список директории (см. выше), определить версию сервера, на основе чего выбрать способ его атаки.

Как же выглядит такой запрос?.. Оказывается - просто: Как видно - он основан на содержании фразы в разделе title страницы директории и фразы , содержащейся в конце любого листинга директории. К примеру, так выглядит запрос, определяющий версию сервера aol.com: .

Также возможно определить версию веб-сервера на основании страниц по умолчанию, установленных на сервере. Чаще всего устанавливаемый веб-сервер поставляется с набором страниц по умолчанию. Имея простую тестовую страницу, администратор может связаться со своим собственным веб-сервером, чтобы удостовериться, что он установлен правильно.

На самом деле, теория очень проста. Чтобы получить интересующую вас информацию, вам нужно попробовать представить, в каких файлах эта информация может находиться, а затем просто попытаться их найти. (Например, попробуйте поискать *.xls файлы). Или же вы можете избрать более интересный подход - подумать, какой софт, установленный на атакуемой машине, предоставляет возможность выполнять нужные вам задачи, затем ввести критические/опасные файлы этого программного обеспечения в строку поиска. Примером может послужить система управления содержанием сайта (content management system). Вам нужно исследовать эту систему, выяснить, какие файлы она в себя включает, а затем воспользоваться google. Самое главное - четко поставить перед собой цель и знать, что вы хотите найти. Только после этого вы можете воспользоваться Google.

Google позволяет искать специальные типы файлов, то есть, как результат поиска, вы получаете не html-страницы (web сайты), а, например, файл Microsoft Excel. Вот что нужно ввести в строку поиска: Filetype:xls (для файлов excel) или filetype:doc для файлов Word.

Наверное, будет интереснее найти файлы *.db и *.mdb. Можно поискать и другие типы файлов. Первое, что приходит на ум - *.cfg или *.pwd, *.dat файлы и т. п. Сначала подумайте, какие файлы могут содержать ценную информацию.

Некоторые основные способы защиты от хакеров, использующих Google:

  • Держите свою секретную информацию подальше от Интернета. Даже если вы думаете, что вы размещаете информацию на веб-сайте временно, есть большие шансы, что вы либо забудете о ней, либо поисковая система может найти её.
  • Используйте приемы, указанные выше для проверки вашего сайта на наличии секретной информации или уязвимых файлов.
  • Примите во внимание возможность убрать ваш сайт из индекса Google. В некоторых случаях вы можете удалить отдельные страницы из индекса Google.
Internet - это сеть, к которой подключены сотни тысяч, а то и миллионов web серверов и по идее, можно получить доступ к любым данным, конечно, если они не защищены подобающим образом. Как разработчики программного обеспечения, так и конечные пользователи должны уделять больше внимания конфигурации защиты, устанавливаемой по умолчанию и политике безопасности. В конце концов, всегда найдутся люди, которые допускают ошибки, устанавливают все по умолчанию, используют плохо защищенное программное обеспечение и совсем об этом не беспокоятся или все еще верят, что ничего не произойдет, если они поместят все это в таком виде в Интернет. Но есть личности, которым нравится находить интересную информацию не для посторонних глаз. Google может вам значительно помочь в таких делах, к тому же это совсем не трудно.