Misha Verbitsky ([info]tiphareth) wrote,
@ 2001-06-05 15:51:00
Current mood: aggravated
Current music:Strafe FR

Поисковая машина как лохотрон
http://www.livejournal.com/users/dm_lihachev/
удивляется по поводу яндексовской секретности

странно мне - зачем таинственность,
што за таки эвристики, про которые рассказать
нельзя, хотя бы примерно.. или ж это военная тайна и кнов хав?

http://www.livejournal.com/talkread.bml?itemid=4816859

А удивляться здесь совершенно нечему,
основной финансовый ресурс поисковой
машины - это подтасовка релевантности
в пользу ресурсов, которые заплатят
(деньгами или борзыми щенками, здесь
уже не так важно).

Но если это выплывет, убытки от скандала
превзойдут всю возможную выгоду от подтасовки.
Чтобы враг не догадался, алгоритм
вычисления релевантности держится
в глубочайшей тайне.

Кстати, "релевантность" эта никому нахер не нужна,
движок Альтависты был и остается с пользовательской
точки зрения самым лучшим движком. Но вот если
отменить "релевантность", подтасовывать будет
совершенно нечего.

Гуголевская, кстати, формула опирается
на уже вычисленный коэффициент для ссылающихся на данный
сайтов; естественно, что (скажем в России) придав произвольно
высокий коэффициент, например, фэповским сйтам, которые
без конца ссылаются друг на друга - можно получить,
по гуголевской формуле, что фэповские сайты
релевантнее всех прочих. А можно наоборот.

То есть Гуголь это тот же самый лохотрон, что и Яндекс,
только они не дебилы и понимают, что хороший наперсточник
делает свои операции открыто и явно. А у Яндекса кривые
ручки не владеют координацией движений, от этого и
секретность дебильная. Наперсток типа приходится
все время под стол ронять и соплями приклеивать.

Такие дела
Миша.



(Post a new comment)


[info]sap
2001-06-05 08:55 (link)
Моих друзей с
http://about.al.ru/
в мае убрали из яндекса за публикацию статьи с анализом яндексовского алгоритма определения релевантности.

(Reply to this) (Thread)


[info]tiphareth
2001-06-05 09:33 (link)

А чем объясняется секретность? Неужто не воровством?

Такие дела
Миша.

(Reply to this) (Parent) (Thread)


[info]sap
2001-06-05 10:09 (link)
Сейчас никого из них в он-лайне нет, поэтому точную формулировку сказать не могу. Обвинения были сплошь надуманные.
Уточню - напишу. Вообще эту историю стоит озвучить, как мне кажется, слишком уж она странная, да и с твоими словами вполне в резонансе (в частной беседе Тема, один из авторов about.al.ru, прямо говорил о торговле местами в топе яндекса, что, собственно, тайна полишинеля, но только на уровне слухов, а у него какие-то факты были).

(Reply to this) (Parent)

За что же все-таки снесли AiK-а (Артема Шкондина)
[info]iseg
2001-06-05 10:08 (link)
Снесли за спам. Обычный такой грязный клоак.
И будем сносить. Пока рука бойцов не устанет колоть!

(Reply to this) (Parent) (Thread)

Re: За что же все-таки снесли AiK-а (Артема Шкондина)
[info]sap
2001-06-05 10:11 (link)
Да, вроде бы такая формулировка и была.
Надо бы разобраться. Интересно очень.

(Reply to this) (Parent)

Re: За что же все-таки снесли AiK-а (Артема Шкондина)
[info]artvs
2001-06-06 00:28 (link)
Снесли за то, что вовремя с правилами изменившимися не ознакомился:

Яndex подключает к своей базе то, что считает Рунетом, и оставляет за собой право на исключение из своей базы любого сайта по своему усмотрению без предуведомления.

Это из новенькой лицензии
http://www.yandex.ru/info/termsofuse.html


Спамом же Яндекс считает "любые элементы, не предназначенные для восприятия человеком ", т.е. переводя на русский с манагерского любые HTML тэги. Человек не их воспринимает, а видит то, как их броузер обрабатывает.

Раньше в правилах было сказано что Яндекс индексирует всё что шевелится, а если он сочтёт страницу за спам, то просто понижает релевантность, а не выкидывает из индекса...

Вобщем нарисовал я страничку. Баальшую такую. Положил её на сайт в пятницу поздно вечером. Проиндексировал. Рано утром убрал с сайта. Она там была всего-то восемь часов, а в индексе и того меньше. Ну пришла на эту страницу сотня другая посетителей. Яндекс это всё профиксировал. Не пондравилось ему количество песетителей на одну страницу. Сайт снесли. Целиком.

Так что я претензий не имею, а вот Илья имеет на меня зуб. Это факт :).



(Reply to this) (Parent)


[info]smaller
2001-06-06 01:46 (link)
Интересно. А статью увидеть где-то можно?

(Reply to this) (Parent) (Thread)

Нельзя, потому что ее не было
[info]iseg
2001-06-06 04:36 (link)
Объясню по подрббнее.

Клоак - это страничка, которая выдается по-разному роботу и браузеру. За эти трюки сносят все. Зайдите на Гугль и почитайте его дисклеймер про клоаки.

При чем тут какая-то неведомая статья?

Если это та статья. в которая Артем доказывает, что Рамблер, Апорт и Яндекс "содрали свой код" из одного и того же западного источника, то ее стоит держать в индексе просто из уважения к реликтовой глупости.

(Reply to this) (Parent) (Thread)

Re: Нельзя, потому что ее не было
[info]stas
2001-06-06 05:00 (link)
Клоак - это страничка, которая выдается по-разному роботу и браузеру.

И что в этом плохого? Ни один известный мне икалочный робот не способен адекватно воспринимать веб-страницы. Насколько мне изестно, яндексовский неспособен точно так же. Поэтому идея сделать отдельную страницу для людей, а отдельную - для умственно неполноценных роботов, представляется мне вполне правильной.

С другой стороны, конечно, эта идея сильно дискредитирована ее использованием для спама. Но спама и без того в нынешних икалках выше головы. А если добавить к этому еще и клинический идиотизм (это не ругательство, а медицинский термин - все известные мне роботы текст не понимают, а тупо сопоставляют слова) - результаты, как правило, оставляют желать.

(Reply to this) (Parent) (Thread)

Re: , - [info]iseg, 2001-06-08 11:28:00
Re: , - [info]stas, 2001-06-09 03:36:53
Re: , - [info]iseg, 2001-06-09 04:20:22
Re: , - [info]stas, 2001-06-09 05:34:17
Re: , - [info]iseg, 2001-06-09 11:43:01
Re: Нельзя, потому что ее не было
[info]artvs
2001-06-06 05:35 (link)

Если это та статья. в которая Артем доказывает, что Рамблер, Апорт и Яндекс "содрали свой код" из одного и того же западного источника, то ее стоит держать в индексе просто из уважения к реликтовой глупости.


Илья, ни Вы, ни Игорь Ашманов не снизошли до объяснения простым смертным, почему ваши поисковики (и Апорт тоже, но их представители вообще на открытую местность не выходят) не считают за спам тысячи(!) слов, размещённые в тэге TITLE? Может багу уже залатали, не проверял.
Два раза - ещё случайность. Три - уже закономерность.

Понятно, что Вам обидно слышать такое заявление. Но убедить в обратном общественность Вы не пожелали...


BTW, даже "из уважения к реликтовой глупости" в индексе статью Вы не оставили :)



(Reply to this) (Parent) (Thread)

Re: , - [info]iseg, 2001-06-06 07:17:33
Re: , - [info]artvs, 2001-06-06 09:29:41
Re: , - [info]iseg, 2001-06-08 11:50:08
Re: , - [info]artvs, 2001-06-08 14:09:24
Re: , - [info]iseg, 2001-06-09 04:23:28
Re: , - [info]artvs, 2001-06-09 08:32:24
если это выплывет?? :))
[info]dm_lihachev
2001-06-05 09:02 (link)
будь так все просто - оно же вычисляется елементарно.. примитивненький робот долбит запросами яндех и напр. какие-то другие поискалки, для сравнения, резалты кладутся в таблички и там нумеруются всяко разно - и через час *вполне доказательный* пакет улик можно передать в любое СМИ...

вполне-доказабельность в том, что этот пакет любой может воспроизвести, его можно прямо с набором из там 10К ссылок на запросы и передавать

всего делов,

я когда-то таким образом сравнивал дружелюбность к нашему кто-ест-кто рамблера и яндеха, т.е. пакет заготовил запросов обо всех участниках каталога - и резалты все сгреб в таблицы..

имхо яндех и др. еще не созрели для таких продаж, это не окончания у слов отрывать, тут действ уже ИИ нужен.. Но ежли в известных кругах така идейка понра, и оне профинансируют - то я смог бы наверное :))

аууу!... потов просветиться, как говорил Урод, влезая в рентгеновский аппарат в шереметьево-2

(Reply to this) (Thread)

Re: если это выплывет?? :))
[info]tiphareth
2001-06-05 09:14 (link)

Да конечно, они пока этим,
наверное, и не торгуют. Но мухлюют уже
сейчас вполне и вполне, их на ЕЖЕ-листе за этим
заставали неоднократно. Или по крайней мере делают
крайне странные и необъяснимые ошибки.

А кроме того, Яндекс это же не один проект, это еще и Народ-ру,
и онлайн-продажи и чертте что. Вот что в пользу каких-то из
этих ресурсов идет мухлеж, я вполне убежден.

Потому что иначе у нас не делается.

Альтависта, кстати, тоже первыми местами в рейтинге
торговала.

Такие дела
Миша.

(Reply to this) (Parent) (Thread)

Что всплывет?
[info]iseg
2001-06-05 10:40 (link)
Кто? кого? когда? за чем? заставал на ЕЖЕ-листе?

Что за деза такая?

Нельзя ли поподробнее?

(Reply to this) (Parent) (Thread)

Re: Что всплывет?
[info]tiphareth
2001-06-05 10:52 (link)
http://www.livejournal.com/talkread.bml?itemid=4820945

Я не помню уже всего, увы, увы. Заставали Яндекс
например за тем, что он на какие-то запросы не показывал
каких-то сайтов, которые у него были проиндексированы.
Из этого выводили какую-то конспирологическую теорию,
звали Женю Завалишину, которая там за спокесвуман.
Завалишина не отвечала.

Точнее не помню, увы. Но недоумение по поводу Яндекса
разносилось над листом круглый год. Поскольку все мои
знакомые уверены, что топ яндексовский на корню
раздан либо раскуплен, никого этот стон не удивлял.

Дождемся Сап-Са-Де, он точнее может расскажет.

Такие дела
Миша.

(Reply to this) (Parent) (Thread)

Re: ? - [info]sap, 2001-06-06 01:11:00
Re: если это выплывет?? :))
[info]artvs
2001-06-06 00:49 (link)
А чему тут всплывать?

Апорт например продаёт 1-ю и 5-ю ссылки в результатах поиска.

Яндекс продаёт места в каталоге, ссылки из которого идут в резултатах поиска первыми.

Так что всё вполне офицально...

(Reply to this) (Parent) (Thread)

Что всплывет?
[info]iseg
2001-06-06 04:32 (link)
Яндекс продаёт места в каталоге, ссылки из которого идут в резултатах поиска первыми.

Яндекс не продает места в каталоге. Это инсинуация.

Яндекс ускоренно помещает сайт в каталог за деньги. При этом "место" деньгами купить нельзя. Вообще. Никогда.

Приведите, пожалуйста, пример 1-го (одного) известного вам случая продажи места в выдаче яндексом. За 4 года его существования. И миллиард отданных пользователям листингов.

Илья

(Reply to this) (Parent) (Thread)

Re: ? - [info]stas, 2001-06-06 04:57:12
Re: ? - [info]iseg, 2001-06-06 07:13:41
Re: ? - [info]stas, 2001-06-06 08:05:25
Re: ? - [info]iseg, 2001-06-08 11:36:43
Re: ? - [info]artvs, 2001-06-06 05:19:07
Re: ? - [info]iseg, 2001-06-06 06:45:09
Re: ? - [info]artvs, 2001-06-07 09:07:52
Re: ? - [info]iseg, 2001-06-07 09:59:34
Re: ? - [info]artvs, 2001-06-07 15:22:32
Re: ? - [info]iseg, 2001-06-08 11:51:56
- [info]stas, 2001-06-09 05:38:54
- [info]iseg, 2001-06-09 09:32:54
Re: - [info]stas, 2001-06-09 15:34:01

[info]iseg
2001-06-05 10:47 (link)
А удивляться здесь совершенно нечему,
основной финансовый ресурс поисковой
машины - это подтасовка релевантности
в пользу ресурсов, которые заплатят
(деньгами или борзыми щенками, здесь
уже не так важно).


Как хорошо вы тут все объясняете. Ну почему же мы сразу не догадались про этот наш основной ресурс.

А мы тут сидим, гадаем. :)

This user has turned on the option that logs your IP address when posting.


Вот это вы правильно! Так и надо! К обороне надо быть готовым всегда!

(Reply to this)


[info]stas
2001-06-05 11:03 (link)
Собственно, большинство западных икалок открыто продают места в топе. Некоторые даже за клики берут - я как-то публиковал в ЖЖ ссылки на каталог производителей спаммерского софта, где каждый клик им должен стоить немножечко денег. Типа если кто хочет оттянуться :)
А в России, типа, нормальная оплата за услугу превращается в балаган.

На самом деле оплата места в топе - вполне нормальна. Если ты ищешь "пылесосы", то вполне логично, чтобы первым вышел не Вася Пупкин с форографией, как он катается на пылесосе с ледяной горки, а крупнейший производитель или продавец оных. А кто крупнейший? Кто может больше бабок дать. Все как надо.

(Reply to this) (Thread)

Большинство - это кто? Давайте разберемся.
[info]iseg
2001-06-06 04:26 (link)
Большинство - это кто? Я из поисковых машин, как таковых, кроме альтависты никого назвать не могу. Да и то она сейчас, по-моему, этим уже не балуется.

Вообще, там, как и здесь, действует закон о рекламе. А именно - реклама должна быть в отдельной секции, на другом фоне и т.д. и т.п.

В вашей же логике, как и у большинства ламеров, все валится в кучу:

- paid placement

- paid inclusion.

Это разные вещи. И для первого - принципиальным является наличие отдельной "рекламной" секции.

paid inclusion - это простое платное влключение в листинг: то есть в индекс (инктоми), или в каталог (яху, луксмарт, яндекс). Но это не проданные места! Отнюдь. Места при этом распределяются как и положено, по "соответствию теме", "значимости" и т.д.

Есть искалка, занимающася аукционной продаже мест- goto. Она представлена в "отдельных", "рекламных" секциях на большинстве ищущих порталов (не путать с искалками как таковыми!). Но у нее на входе висит большой дисклеймер, а на выдаче рисуется, сколько стоит данный клик. Это, по сути, поиск в рекламных объявлениях. Когда их не хватает, снизу, в отдельной секции, пристраивают нормальную "непродажную" веб выдачу от инктоми.

Ни яндекс, ни рамблер закон о рекламе не нарушают.

Продажа помещения в каталог никак не связана с paid placement, которого в яндекс просто нет.
И никогда не было. И никогда в скрытой форме не будет.

А всякие недобросовестные или просто неграмотные рассуждения на эту тему лучше оставлять при себе.

Илья

(Reply to this) (Parent) (Thread)

Re: Большинство - это кто? Давайте разберемся.
[info]stas
2001-06-06 04:48 (link)
Дяденька, тока давайте не будем ламером обзываться, ладно? Типа кто ламером обзывается, тот сам так называется, так обычно выходит, ага? Меня ламером называли столько раз, что я это воспринимаю исключительно юмористически. Типа 15 лет в этом бизнесе способствуют :)

Места при этом распределяются как и положено, по "соответствию теме", "значимости" и т.д.


Типа начнем с того, что все алгоритмы являются закрытыми, а потому знать, как они распределются на самом деле, вы не можете. Но я вам скажу - практически распределются никак. Т.е. кроме гугля, серьезной сортировки результатов ни у кого просто нет. Все что есть в печи - все на стол мечи. Можно ли их вообще реально распределять - это другая тема, к пожарной охране отношения не имеющая.

У гугля, кстати, рекламки тоже как-то появились, а потом то-ли пропали, то ли их запихнули куда... Во всяком случае, я их больше не вижу.

А именно - реклама должна быть в отдельной секции, на другом фоне и т.д. и т.п.

И что это меняет? Если у меня в результатах поиска первые 10 будут на другом фоне и на них написано "paid placement", то они от этого перестанут быть первыми 10? Или все специально из ненависти к рекламе пойдут смотреть вторые 10? Нифига не пойдут. И это правильно.

Ни яндекс, ни рамблер закон о рекламе не нарушают.

А я типа утверждал, что нарушают? Или что не надо продавать место за бабки? Наоборот, я утверждал и буду утверждать, что надо и как можно скорее. И что не надо этого стыдиться и не надо из этого устраивать тайны мадридского двора. Вы вообще читали то, чем возмущаетесь? ;) Или у вас knee-jerk reaction, как говорят наши американские друзья?

(Reply to this) (Parent) (Thread)

Re: Большинство - это кто? Давайте разберемся.
[info]iseg
2001-06-06 06:57 (link)
Меня ламером называли столько раз, что я это воспринимаю исключительно юмористически.

Ок. Это не ламерство. Это просто "глубокий непрофессионализм в суждениях".

Например, вот в этом перле:

Т.е. кроме гугля, серьезной сортировки результатов ни у кого просто нет

А чем, по вашему, гугль отличается от других искалок? А то я, признаюсь, подзабыл. :)

А я типа утверждал, что нарушают? Или что не надо продавать место за бабки? Наоборот, я утверждал и буду утверждать, что надо и как можно скорее.

Да, пожалуй вы правы и наш диалог бесплоден. Трудно доказывать, что имеешь какие-то убеждения, человеку, которому они, собственно говоря, до едрени-фени.

Надеюсь, что большинство нормальных людей солидарно со мной в неприятии скрытой рекламы. Сиречь, обмана пользователей.

И что не надо этого стыдиться и не надо из этого устраивать тайны мадридского двора

Где, когда, какие тайны? О чем все это?

(Reply to this) (Parent) (Thread)

Re: - ? . - [info]stas, 2001-06-06 08:35:29
Re: - ? . - [info]iseg, 2001-06-08 11:42:26
Re: - ? . - [info]stas, 2001-06-09 03:21:01
Re: - ? . - [info]iseg, 2001-06-09 11:27:54
Re: - ? . - [info]stas, 2001-06-09 15:32:04
Re: - ? . - [info]tiphareth, 2001-06-07 13:20:10

[info]stas
2001-06-05 11:06 (link)
движок Альтависты был и остается с пользовательской
точки зрения самым лучшим движком.


Альтависта - говнище. И стала таковой несколько лет назад - примерно тогда же, когда перестала быть единственной. Из всех существующих машин у гугля - результаты лучшие по соответствию результата вопросу. Еще alltheweb неплох, остальные можно сливать. А то, проплачивают релевантность или нет, мне плевать. Пусть хоть деньгами, хоть щенками, лишь бы он мне находил нужное.

(Reply to this) (Thread)


[info]tiphareth
2001-06-05 11:11 (link)

Нужное мне Гугль не находит.
Альтависта находила, потому что
у ней был строгий синтаксис запросов.
Она была в десятки раз удобнее.

А сейчас она не годится, но не из-за движка,
а из-за дебилизации интерфэйса и позорной
устарелости баз данных.

Такие дела
Миша.

(Reply to this) (Parent) (Thread)


[info]jetteim
2001-06-06 01:04 (link)
А ты попробуй у гугля попросит "сетевое говно". Тогда найдёт то, что тебе нужно.

(Reply to this) (Parent) (Thread)


[info]stas
2001-06-06 03:32 (link)
Попробовал. "Мне повезет" отправило к какому-то гельмановскому конкурсанту. А вообще крайне любопытная подборка. Гельман, юморист.ру, Катя Деткина, Кулички, Тенета, Лито, ЕЖЕ-Правда... Короче, вся тусовка там.

(Reply to this) (Parent)


(Post a new comment)


[ Home | Update Journal | Login/Logout | Browse Options | Site Map ]