Статьи Новости Контакты

13.07.2007
Михаил Брод

Надстройки к Google

надстройки к Google

Поисковую систему Google знают, наверно, все. Очень многие используют ее для поиска информации. Сегодня по востребованности она находится на первых местах среди аналогов вместе с Яндексом. Что-то ищется лучше на Яндексе, что-то на Google, а вместе они дают очень неплохие результаты. Но многие ли знают, что Google можно использовать и несколько иначе, используя его поисковые возможности, но добавив в них дополнительную функциональность.


Например, поиск фотографий. Знаете ли вы, что их можно искать не только по названию, но еще и по типу камеры, на которых они снимались? Цифровые фотокамеры присваивают полученным с их помощью фотографиям цифровые номера, которые довольно точно могут указать, какая камера была использована. Соответствие между названиями файлов и цифровыми камерами можно показать следующей таблицей:

  • "dcp#####.jpg" — Kodak, диапазон от 0 до 4000
  • "dsc#####.jpg" — Nikon, диапазон от 0 до 4000
  • "dscn####.jpg" — Nikon, диапазон от 0 до 4000
  • "mvc-###.jpg" — Sony Mavica
  • "mvc#####.jpg" — Sony Mavica
  • "P101####.jpg" — Olympus, используются установленные по умолчанию номера от 101
  • "PMDD####.jpg" — Olympus, где M — в шестнадцатеричной форме от 1 до c, DD от 01 до 31
  • "IMAG####.jpg" — RCA и Samsung
  • "1##-####.jpg" — Canon 1TH-TH## тысячи, сотни
  • "1##-####_IMG.jpg" — альтернативное название Canon
  • "IMG_####.jpg" — Canon
  • "_MG_####.jpg" — Canon с низким разрешением
  • "dscf####.jpg" — Fuji Finepix
  • "pdrm####.jpg" — Toshiba PDR
  • "IM######.jpg" — HP Photosmart
  • "EX######.jpg" — HP Photosmart timelapse
  • "DC####S.jpg" — Kodak DC-40,50,120 S — (L)arge, (M)eduim, (S)mall.
  • "pict####.jpg" — Minolta Dimage.
  • "P#######.JPG" — Kodak DC290.
  • "MMDD####.JPG" — Casio QV3000 and QV4000.
  • "YYMDD###.JPG" — Casio QV7000 — где M в шестнадцатеричном значении.
  • "IMGP####.JPG" — Pentax Optio S.
  • "PANA####.JPG" — Panasonic видеокамера
  • "IMG_###.jpg" — некоторые иные камеры
  • "Image(##).JPG" — Nokia 3650 (телефон с камерой)
  • "DSCI####.JPG" — Polaroid PDC2070.

Используйте при поиске изображений идентификаторы цифровых камер
На Google изображения с такими наименованиями отыскиваются очень хорошо. И вот какой запрос можно сделать для поиска конкретного изображения:
P0007979.jpg filetype:jpg
Впрочем, проверка поиска без ввода типа файла дала аналогичный результат. Подробнее об этом варианте поиска написано на сайте diddly.com. Подобный поиск можно выполнять и через названный сайт, и непосредственно на Google.

Результаты поиска по двум поисковикам выдаются в одном, разделенном на две половины, окне браузера
Более интересными, впрочем, являются решения, связанные с параллельной выдачей информации по одному запросу из Google и Yahoo! Сторонние разработчики, используя предоставленные этими поисковиками API, создали свои варианты выполнения запросов. Например, сайта TwinGine формирует единый экран результатов, полученных с этих двух поисковиков. Общее поле экрана разделено на две половины, в каждой из которых выданы результаты поиска одной из поисковых машин. Результаты довольно интересные, особенно в плане сравнения места вывода одних и тех же сайтов разными поисковиками. Например, по запросу Google hacks Google нашел свыше 31 миллиона ссылок и потратил на это одну десятую секунды, а Yahoo! Представило 18,5 миллионов, потратив на этой 0,14 секунды. А книгу под названием «Google Hacks» издания O'Reilly Yahoo! показало на первом месте, тогда как Google выдал ее лишь на пятом.

Этот вариант поиска можно добавить в качестве расширения в FireFox, добавить в свой блог на Blogger или разместить строку поиска на своем сайте:

<form style="text-align:center;" method="get" action="http://twingine.com/search.php">
<input type="text" name="q" size="16"/>
<input type="submit" value="Twingine Search"/>

Но все же сравнивать результаты поиска даже в том случае, если они приведены на одном экране, сложно и может быть интересно больше тем, кто занимается исследованием качества работы поисковиков. А вот сервис, предложенный на сайте langreiter.com/, в плане сравнения результатов предоставляет значительно большие удобства. В первую очередь в связи с тем, что результаты поиска двух поисковиков сравниваются графически.

Графическое сравнение результатов дает наглядное представление об их равнозначности
График выполнен в виде двух параллельных линий, на каждой из которых расположено по сотне точек. Верхняя относится к Google, нижняя — к Yahoo!. Каждая точка соответствует найденной поисковиком ссылке. Если ссылки одинаковые — они соединяются отрезком прямой. Чем больше одинаковых ссылок найдут поисковики, тем больше будет отрезков, соединяющих прямые. Интересно, удастся ли кому-нибудь найти такое поисковое выражение, для которого поисковики найдут абсолютно разные ссылки или наоборот, когда все ссылки будут одинаковыми?

Если подвести курсор к точке на любой прямой, увидите ссылку, а щелчок по этой точке перенаправит вас на найденную страницу. Для поиска и просмотра результатов такой формат представления информации не удобен, а вот для сравнения — полезен. Было бы интересно сравнить результаты, выдаваемые Google и Яндексом.

Еще один вариант поиска предлагается на сайте Dogpile. Здесь поиск выполняется параллельно по четырем поисковым системам — Google, MSN Search, Yahoo! Search, Ask.com. В строке поиска задается поисковое выражение, выполняется поиск и формируется сводный список. Фактически, это метапоисковик, формирующий результаты на основе поиска по нескольким ведущим поисковым машинам. При этом в результаты поиска включаются как платные, так и бесплатные ссылки, полученные с этих поисковиков.

Теперь можно увидеть, какие сайты проиндексированы для вашего запроса ведущими поисковыми машинами
Вывод результатов может быть сформирован двумя способами. В первом случае результаты выстраиваются по их релевантности запросу вне зависимости от того, на каком поисковике они были найдены. У каждого результата указывается, с какой поисковой машины он был получен. Поэтому даже среди наиболее релевантных ссылок могут находиться ссылки, найденные как на одном из запрашиваемых поисковиков, так и на всех вместе. При втором варианте формирования результатов, вывод будет формироваться в разрезе поисковых машин. При этом на первой странице будет выведено по 10 первых ссылок по каждому поисковику, на второй — следующие десятки.

Если вы ищете музыкальные, аудио или видеофайлы, вы также можете использоваться два варианта формирования результатов. Первый результат — по релевантности запросу, второй — по провайдерам, предлагающим запрашиваемые материалы. Этот поиск ведется по Yahoo! Search, Singingfish и Blinkx. Для поиска новостей используются ресурсы Yahoo! Search, Topix, Fox News и ABC News.

И еще один вариант визуализации поиска по Google. Он визуализирует запрос, который выглядит в Google как related: <адрес сайта>. Фактически, с помощью этого оператора выполняется поиск сайтов, ссылающихся на интересующий вас (либо где размещены ссылки на этот сайт). Например, если с помощью этого выражения поискать, какие сайты ссылаются на наш — hostinfo.ru, то получим около 30 ссылок, что, впрочем, истине не вполне соответствует (хотя бы потому, что и на моем сайте есть ссылка на Hostinfo.ru, но в число ссылающихся он не включен). Впрочем, это не недостаток, а ограничение Google — по умолчанию он выдает до 30 ссылающихся сайтов.

Так вот, проект TouchGraph представляет в визуальном виде результаты обработки запроса оператора related: Для того, чтобы можно было посмотреть, как он работает, необходимо установить на своем компьютере библиотеки для работы с Java. Перейдите на страницу и введите в поле запроса адрес интересующего вас сайта. Через некоторое время в окне вашего браузера начнут появляться кружки, линии, постепенно размещающиеся на экране. В центре — запрошенный вами сайт, от которого расходятся линии, связывающие его с другими кружками. И обратите внимание на то, что от них также расходятся линии — это уже ссылки на сайты, которые ссылаются на вас.

Кружево узлов и линий дает представление о взаимосвязи различных сайтов через ссылки друг на друга
При первом выводе результатов на экране будет размещено до 110 ссылок — до 10 сайтов, ссылающихся на ваш, и до 10 ссылок, ссылающихся на первые десять. 110 ссылок — это далеко не все, что могут ссылаться на исходный и найденные сайты. Чтобы увидеть следующие, щелкните дважды по любому узлу, и будет построено еще 10 дополнительных ссылок и, как и в первом случае, ссылающиеся на новые ссылки сайты. Экран может оказаться просто переполненным этими ссылками, поэтому есть возможность скрывать или удалять ненужные узлы. Второй способ — масштабирование изображения. Третий — изменение того, что выводится в описании узлов. Это могут быть адреса сайтов, их описания, взятые из тега title, либо первые две буквы адреса (в этом случае буквы www отбрасываются). Третий вариант наиболее лаконичен, зато наиболее вместителен. Есть одно неудобство — пока не поддерживаются русские буквы и описания, выполненные на русском языке, представлены в нечитаемом виде.

Вот такие интересные сервисы выстраиваются вокруг ведущей поисковой машины Google. Наверняка вы знаете и другие варианты, где используются результаты работы Google, поскольку компания предоставляет доступ внешних пользователей к своему интерфейсу и возможностям использования поисковых ресурсов в своих решениях.




Скоро на сайте

  • Wordpress

    Серия статей о плагинах к движку WordPrress
  • AJAX

    Проекты и продукты, ориентированные на AJAX
  • Новые сервисы Google

    Обзор новых сервисов Google
 

Copyright © 2003—2017 Все права защищены

При использовании материалов сайта ссылка на hostinfo.ru обязательна

  • хостинг от .masterhost
  • Rambler's Top100