Monday, January 3, 2011

Advanced Google Boolean Search

Базовые логические операторы, о которых здесь уже шла речь, действительно могут помочь рекрутеру в поиске нужных кандидатов. Но для того, чтобы воспользоваться всеми возможностями Boolean Search, нужно копнуть еще глубже. Сегодня мы поговорим о менее распространенных (но от этого не менее полезных) операторах поисковой системы Google.
Итак давайте знакомиться: site:, inurl:/allinurl:, "", *, filetype:, link:, intitle:/allintitle:, intext:/allintext:, inanchor:/allinanchor:, info:,cache:.

Более подробно каждый из этих операторов описан непосредственно на сайте Google, я же остановлюсь на наиболее применимых именно с точки зрения рекрутинга.

site:

Позволяет ограничить поиск определенным сайтом или доменом.

Пример запроса: site:moikrug.ru "Разработчик ПО"

В результате мы получим список всех страниц на сайте http://moikrug.ru/, которые содержат словосочетание "Разработчик ПО".
Оператор site: просто незаменим, когда нам нужно ограничить результаты поиска одним или несколькими (благодаря использованию OR) сайтами, кроме того, он используется при так называемом X-Ray поиске. Ниже еще несколько примеров использования этого оператора:

Пример запроса: site:moikrug.ru OR site:linkedin.com ("Java" OR "J2EE" OR "JEE") (Ukraine OR Украина)

Пример запроса: site:developers.org.ua "Global Logic"

На первый взгляд может показаться, что приведенные примеры не несут никакой практической пользы, но я еще раз повторюсь что пока мы просто изучаем возможности операторов. Я обязательно поделюсь практическими примерами запросов для поиска кандидатов, но немножко позже:)

inurl:

Этот оператор позволяет вести поиск только по тем URL, которые содержат определенное слово или набор символов (в этом случае используем allinurl:).

Пример запроса: inurl:resume (Киев OR Kyiv OR Kiev) "QA Engineer"

В результате мы должны получить перечень всех страниц, которые содержат resume в URL, а также содержат слово Киев (в одном из 3 вариантов написания) и фразу "QA Engineer".

Оператор inurl: в сочетании с оператором site: позволяет выделить страницы определенного типа на нужном ресурсе. К примеру, используя строку поиска...

Пример запроса: site:www.work.ua inurl:resumes keyword1 keyword2

…мы можем непосредственно из Google выделить нужных нам кандидатов на популярном сайте по поиску работы Work.com.ua. Еще один пример (на этот раз мы используем еще и оператор "-")…

Пример запроса: site:http://dev.by inurl:users -inurl:comments -inurl:posts -inurl:opinions keyword1 keyword2

…позволяет нам провести поиск по профайлах пользователей популярного в Беларуси портала Dev.by.

Как мы можем убедиться, эти запросы уже позволяют нам получить результаты более релевантные к потребностям рекрутера, чем при использовании только базовых операторов. Но мы идем еще дальше:)

""

Кавычки используются в том случае если нам необходимо провести поиск по определенной фразе. Эта возможность может использоваться, когда мы хотим выделить страницы с определенным типом информации (к примеру X-Ray поиск по МойКруг) или просто пытаемся найти конкретную фразу.

Пример запроса: site:moikrug.ru "Специализация и профессиональные навыки" автотестирование

Запрос такого типа позволяет нам включить в результаты поиска только те страницы, которые являются профайлами участников МойКруг, что дает возможность значительно сократить время, затраченное на просмотр результатов и гарантирует релевантность информации.

*

Этот оператор при построении строки поиска указывает Google на то, что на его месте могут быть одно или несколько слов. К примеру, запрос типа…

Пример запроса: "* engineer" resume (Kiev OR Kyiv) Ukraine

…выдаст страницы, которые могут содержать следующие словосочетания: "software engineer", "QA engineer", "quality assurance engineer", "build engineer" и т.д.Еще одна интересная область применения этого оператора – возможность выделить специалистов с определенным количеством лет опыта при проведении X-Ray поиска.

filetype:

Используя этот оператор, мы можем ограничить территорию нашего поиска файлами определенного типа.

Пример запроса: (resume OR CV) (Kiev OR Kyiv) filetype:pdf

В результате мы получим линки на все pdf-документы, которые содержат указанные нами ключевые слова и были индексированы Google.
С расширенным списком поддерживаемых типов файлов можно ознакомиться здесь.

link:

Позволяет проверить, какие веб-страницы содержат ссылку на определенный линк.

Пример запроса: link:developers.org.ua

Результат – список страниц, которые содержат ссылки на этот популярный среди ИТ-специалистов Украины ресурс.

Один из вариантов использования этого оператора в целях рекрутинга – можно быстро найти веб-страницы, связанные с определенным кандидатом, если использовать адрес его Public profile в сетях LinkedIn или МойКруг.

intitle: (allintitle:)

Задача этого оператора ограничить поиск только теми страницами, которые содержат определенное слово в области title.

Пример запроса: inurl:resume intitle:резюме (Киев OR Kyiv OR Kiev) "QA Engineer"

intext: (allintext)

Аналогичен по принципу действия предыдущему оператору и позволяет проводить поиск только в теле веб-страницы. Если ключевые слова, которые вы обозначили, встречаются, к примеру, только в title страницы, но не встречаются в тексте, то такая страница не будет включена в результаты поиска.
И несколько дополнительных профайлов, которые реже могут использоваться в целях рекрутинга.

inanchor:(allinanchor:)

Позволяет выделить только те страницы, которые содержат ссылки, в тексте которых есть указанное нами ключевое слово или фраза.

info:

Показывает информацию об указанном сайте и предоставляет несколько возможностей:

- просмотреть кешированную версию сайта (cache:)
- найти сайты, похожие на этот (related:)
- найти страницы, которые содержат линк на этот сайт (link:)
- найти страницы непосредственно на этом сайте (site:)
- найти страницы, на которых упоминается этот сайт ("")

Пример запроса: info:http://ua.linkedin.com/in/vicsor

В результате мы получим информацию о моем профайле на LinkedIn:)

cache:

Возвращает кэшированную копию страницы с указанным адресом или URL. Одно из преимуществ просмотра кешированных страниц – на них сразу подсвечиваются ключевые слова, указанные при поиске.

2 comments:

Nikita Bleshchyk said...

Достаточно интересная информация. В университете, по-моему, у нас "Boolean Search" называли ИПЯ (информационно-поисковый язык).
Похожую информацию о морфологии и особенностях поиска в Яндекс можно найти тут: http://help.yandex.ru/search/?id=1111369

Хотелось бы узнать мнение автора по поводу мета- поисковых машин, например, Nigma.ru

Доп. информация тут: http://ru.wikipedia.org/wiki/%D0%9D%D0%B8%D0%B3%D0%BC%D0%B0

Victor Soroka said...

Спасибо за комментарий. У меня есть определенный скепсис по поводу использования подобных поисковых систем именно в рекрутинге - слишком много нюансов которые сложно предугадать, но они могут быть весьма полезны в других индустриях при сборе информации.

Post a Comment

Related Posts Plugin for WordPress, Blogger...