Sunday, April 10, 2011

А кого вы сможете найти в LinkedIn?

Всю последнюю неделю я пытался разгадать очередную загадку от Glen Gathey. Идея «соревнования» в том, кто сможет составить поисковый запрос, который выдаст наибольшее число результатов среди пользователей LinkedIn.
Поэкспериментировав с несколькими вариантами, я понял, что LinkedIn имеет определенные трудности с обработкой запросов, которые должны выдавать более 50 миллионов результатов.

После прохождения этого порога всё чаще возникает уведомление:
«We are currently upgrading the search engine. Search will be back momentarily».
Поэтому максимальный результат, которого мне удалось достичь – 54,307,525.

Для этого я использовал строку поиска из 220 слов, которые содержат название наиболее распространённых в мире профессий. Тем не менее, у меня осталось ощущение, что это пока не окончательное решение загадки. Поэтому, если у кого-то есть идеи, как можно увеличить этот результат, буду рад их обсудитьJ

Фактически, система поддерживает неограниченное (в разумных пределах) количество слов, которые вы можете включить в свой поисковый запрос, но проблемы возникают тогда, когда количество результатов превышает 50 миллионов.

Одна из идей, которая у меня возникла – составить 2 или три запроса, которые позволят разбить одну большую группу результатов на несколько подгрупп. Ведь на самом деле результат запроса (A OR B) можно передать через сумму результатов 3-х запросов (A NOT B), (A AND B), (B NOT A). К примеру, пусть А у нас = Jython (реализация языка Python на языке Java), a B = Hadoop (технология, которая используется при облачных вычислениях). Кстати, пример взят из реальной жизни, именно кандидата с таким «оригинальным» набором технологий мне недавно пришлось искать.

Проверим, действует ли наша теория в реальном поиске, итак:

Jython OR Hadoop = 5691
Jython NOT Hadoop = 1471
Jython AND Hadoop = 18
NOT Jython Hadoop =4202
1471 + 18 + 4202 = 5961

Теория верна. Но проблема в том, что в нашем случае мы имеем дело не с двумя ключевыми словами – их больше двух сотен, и подобрать правильный набор, не получив при этом вышеупомянутое сообщение от LinkedIn, мне пока не удалось.

Тем не менее, мне кажется, что эта загадка должна иметь более изящное решение, чем просто увеличение количества ключевых слов. Идеи?

P.S. Согласно статистике посещений этого блога, одна из наиболее популярных его записей - LinkedIn - количество пользователей в разных странах. Не так давно LinkedIn писал о преодолении рубежа в 100 миллионов пользователей, поэтому я хочу поделиться обновленными (на 6 апреля этого года) цифрами по Украине и России:
- Russian Federation: 339,584
- Ukraine: 160,520

No comments:

Post a Comment

Related Posts Plugin for WordPress, Blogger...