Разработка открытой поисковой системы

Автор Тема: Разработка открытой поисковой системы  (Прочитано 464 раз)

Оффлайн EcoАвтор темы

  • Рекрут
  • *
  • СПАСИБО: 3
  • Сообщений: 14
  • Карма: 1
    • Просмотр профиля
Коллеги,
рады сообщить об открытии публичного доступа к разработке открытой поисковой системы [nofollow].

В настоящий момент есть масштабируемая техническая площадка, реализовано большинство основных принципов и алгоритмов группой разработчиков за период 2010-2011г. Сейчас планируется формирование открытой общественной группы среди сторонников открытых систем.

Открытая разработка позволит получить принципиально новую поисковую систему с практически не ограниченным функционалом и высокой эффективностью.

Приглашаем желающих принять активное участие в тематическом обсуждении по различным направлениям от дизайна и программного кода до поисковой оптимизации и системного проектирования.

Оффлайн Michael J Fox

  • КМС
  • *****
  • СПАСИБО: 341
  • Сообщений: 1534
  • Карма: 41
  • Пол: Мужской
  • Best Or Nothing
    • Просмотр профиля
    • Глас Закона | Правовой Портал
а где русский язык? по какому принципу работает система, чем отличается от гигантов?

Добавлено: 05-01-2012, 03:40:46

охх, блин, это на свежую голову читать надо.
« Последнее редактирование: 05-01-2012, 03:40:46 от VoxLex »

Оффлайн EcoАвтор темы

  • Рекрут
  • *
  • СПАСИБО: 3
  • Сообщений: 14
  • Карма: 1
    • Просмотр профиля
а где русский язык? по какому принципу работает система, чем отличается от гигантов?
В системе русский стоял по умолчанию, сейчас пока праздники подключаем geoip - отсюда до 10.01.12 возможен английский язык при первом входе. Изменить локаль можно в настройках [nofollow].
С 10 по 24.01.2012 будет подготовлено краткое видео по дополнительному функционалу (отличиям),
Основные принципы [nofollow] изложены в открытом разделе.

Оффлайн gr

  • Пользователь
  • **
  • СПАСИБО: 24
  • Сообщений: 77
  • Карма: 7
    • Просмотр профиля
Конечно, для меня все это темный лес. Но как-то из общих соображений не ясно, как такой огромный проект можно сделать. Фантастика какая-то.

Наивные вопросы

1. Финансирование
Какова ожидаемая конечная стоимость проекта. В деньгах и в человекочасах. Откуда возьмутся деньги? Если денег не будет, откуда возьмутся серьезные девелоперы? Если стоимость проекта будет, скажем, порядка миллиона, уж не знаю чего, рублей или часов, то где гарантии, что проект за этот миллион не будет продан через год-два. Если проект выйдет на серьезную мощность, пусть тысячная доля от Яндекса, почему бы тому же Яндексу его не скупить себе. 

2 Технология
Каков уровень участников проекта, если их набирают даже на сео ресурсах. Да пусть даже с Хабра. Есть ли там уже народ с гуглов-яндексов? Есть ли у них четкое понимание, как старые проекты работают? Почему и каким образом команда людей, работающих в свободное от работы время, т.е. любителей, сумеет конкурировать с профи, да еще с отставанием в десяток(!) лет. Опыт Линуксов и Друпалов с Википедиями обнадеживает, но во-первых, кто-то в команде должен вкалывать по-черному, без гарантии успеха проекта. Есть такие? Во -вторых, нет ли у Вас ощущения, что поезд давно ушел? 

3. Новизна
В чем новизна проекта, если говорить для чайников? Открытость как козырь не идет вроде бы. Заставить миллионы людей фильровать контент... Так ЖЖ, ссылки, СЕО, кнопки в Гугл плюс и твиттерах именно этим и занимаются... Остальное пока как слова и благие намерения выглядят. Идеи... вроде бы все перебраны. На классическом поле переиграть старых игроков... за счет гениальной идеи, лежащей на поверхности... ну это будет супер круто. Что говорят Платоны и прочие Брики по поводу новой идеи?

4. Опыт забугра
Не секрет, что в сети мы до сих пор проигрывали все основные ИТ новинки иностранцам. И, ощущение, что проиграли практически безнадежно. Просто у нас стартапы так медленно крутятся в силу нашей отсталости...  Все эти вконтакты и прочие Яндексы жутко крутыми выглядят у нас только. А будут ли они когда в мире доминировать ... ну очень не ясно. 

Был ли опыт подобных открытых поисковиков на Западе. Какой? Если не было, то почему? Неужели настолько тупы и ленивы люди?

5. Правовая поддержка
Каким образом сборная солянка разработчиков зафиксирует свои права? Кому принадлежат домен, сайт, движок и т.д.

В целом не видно идеи и, а самое главное, свободной ниши, в которой новый проект мог бы изначально вклиниться между гигантами. Если бы идея состояла в том, чтобы подключать сверх-тщательный анализ текста, ограничиваясь при этом мелкими масштабами, было бы более реалистично, например, семантический анализ российских СМИ (только!) или образовательного сектора (только) и т.д. Но уж странички по косточкам разбирать... Только где такие мощности процессорные брать? 

Т.е. грубо говоря - где та ниша, в котрой Гугл неуверенно ищет нужное. Где он глючит постоянно?

Извините за наивные вопросы. Мне бы очень хотелось, чтобы наши разработчики чем-то наконец выстрелили кроме тетриса... Искренне желаю вам всяческих успехов.

Но, возможно, что прояснение таких вопросов привлекло бы к Вам более серьезный контингент. А до тех пор пока идея формулируется на уровне "теории графов" и "матриц", ... ну не понятно все это, уж слишком наивно выглядит. Как крючок для школьников, которые эти графы чем-то супер умным считает.

Оффлайн EcoАвтор темы

  • Рекрут
  • *
  • СПАСИБО: 3
  • Сообщений: 14
  • Карма: 1
    • Просмотр профиля
Конечно, для меня все это темный лес. Но как-то из общих соображений не ясно, как такой огромный проект можно сделать. Фантастика какая-то.
С такой глубиной вопросов лес для вас далеко не темный, по крайней мере вы его отлично представляете. Постараюсь ответить не менее детально:

1. Финансирование
Какова ожидаемая конечная стоимость проекта. В деньгах и в человекочасах. Откуда возьмутся деньги? Если денег не будет, откуда возьмутся серьезные девелоперы?
Конечная стоимость. Точную цифру по очевидным причинам (особенно публично) сообщить не могу, однако подчеркну что до начала проекта был подготовительный период (в том числе финансовый). Бюджет на текущий год рассчитан для реализации плана-графика работ на 2012, есть спонсоры и не большие партнерские программы.

Человекочасы. По затраченному времени подробная статистика не ведется: основная группа 6-8-12-14-16 человек в зависимости от этапов, общее количество человек уже принявших участие в закрытой разработке и тестировании (2011 год) 124 человека. Если вопрос был бы "сколько человекочасов сейчас необходимо для поддержания/разработки системы в месяц?" то ответ был бы таким: 50-100 часов поддержка, 400-500+ часов разработка если брать минимум по чистому времени работы в системе (т.е. без учета времени планирования, согласования, обсуждения, координации, фокус-групп, обедов/перекуров и т.д.).

Девелоперы. На настоящий момент у нас отличная команда: все конечно же работают в ИТ сфере, с большим опытом разработки/внедрения/сопровождения промышленных/отраслевых ИТ систем.

Если стоимость проекта будет, скажем, порядка миллиона, уж не знаю чего, рублей или часов, то где гарантии, что проект за этот миллион не будет продан через год-два.
Опенсорс — он закрепляется и публикуется под подходящей лицензией.

Если проект выйдет на серьезную мощность, пусть тысячная доля от Яндекса, почему бы тому же Яндексу его не скупить себе. 
Базовая часть системы находится в опенсорсе, её алгоритмы не будут работать с необходимой эффективностью в коммерческих системах. Так же как Опенстрит мапс,  Линукс и Друпал с Вики (о которых вы упоминали) — это принципиально другие, опенсорс системы.
2 Технология
Каков уровень участников проекта, если их набирают даже на сео ресурсах. Да пусть даже с Хабра.
Уровень см. Девелоперы.
Почему «даже на сео ресурсах?» - приглашения будут намного шире включая например дизайн, графику и т. д. Тут скорее дело во вкладе, мелочей не бывает.
Есть ли там уже народ с гуглов-яндексов? Есть ли у них четкое понимание, как старые проекты работают?
Первую часть вопроса пропущу по этическим соображениям, касаемо понимания тут скорее лучше спросить «Есть ли понимание какие возможности развития у других проектов в краткосрочной и среднесрочной перспективе?» Такое понимание (с некой долей вероятности) у нас есть.
Почему и каким образом команда людей, работающих в свободное от работы время, т.е. любителей, сумеет конкурировать с профи, да еще с отставанием в десяток(!) лет. Опыт Линуксов и Друпалов с Википедиями обнадеживает
Скажите это Товальдсу, Уэйлс, основателям опенстритмапс и еще доброй дюжине проектов. Лично на мой взгляд открытые решения открывают больший/иной горизонт функциональности. 10 лет? На мой взгляд время открытых систем только наступает.

но во-первых, кто-то в команде должен вкалывать по-черному, без гарантии успеха проекта. Есть такие?
Есть, С большой буквы.

Во -вторых, нет ли у Вас ощущения, что поезд давно ушел? 
Есть, но на наш взгляд тот поезд ушел в другую сторону)

3. Новизна
В чем новизна проекта, если говорить для чайников? Открытость как козырь не идет вроде бы. Заставить миллионы людей фильровать контент... Так ЖЖ, ссылки, СЕО, кнопки в Гугл плюс и твиттерах именно этим и занимаются...
Новизна в принципе и алгоритмах заложенных в систему, вы правильно заметили базис системы. Открытость присутствует обязательно так как добавляет не допустимый ранее функционал. «Заставлять» фильтровать мы не собираемся, как раз автоматизация данного процесса запланирована на 2012. Полагаю тут можно возразить — знаем, все системы занимаются фильтрацией — время покажет. Подождите пресc-релиза для конкретики.

Остальное пока как слова и благие намерения выглядят. Идеи... вроде бы все перебраны. На классическом поле переиграть старых игроков... за счет гениальной идеи, лежащей на поверхности... ну это будет супер круто. Что говорят Платоны и прочие Брики по поводу новой идеи?
Рано пока «говорить» - развернутых пресс релизов нет, PR компании нет и не планируется до конца 2012. Пока идет разработка и увеличивается число участников.

4. Опыт забугра
Не секрет, что в сети мы до сих пор проигрывали все основные ИТ новинки иностранцам. И, ощущение, что проиграли практически безнадежно. Просто у нас стартапы так медленно крутятся в силу нашей отсталости...  Все эти вконтакты и прочие Яндексы жутко крутыми выглядят у нас только. А будут ли они когда в мире доминировать ... ну очень не ясно. 

Был ли опыт подобных открытых поисковиков на Западе. Какой? Если не было, то почему? Неужели настолько тупы и ленивы люди?
Информация по зарубежным/любым открытым поисковым системам отслеживается более 4х лет и находится в закрытом системном разделе. Увы, я не могу опубликовать эти данные. Кратко - там всё "хорошо", ситуация благоприятная, а вот с Востоком все не так однозначно.

5. Правовая поддержка
Каким образом сборная солянка разработчиков зафиксирует свои права? Кому принадлежат домен, сайт, движок и т.д.
Это вопрос скорее к юристам, они занимаются данным вопросом.

В целом не видно идеи и, а самое главное, свободной ниши, в которой новый проект мог бы изначально вклиниться между гигантами. Если бы идея состояла в том, чтобы подключать сверх-тщательный анализ текста, ограничиваясь при этом мелкими масштабами, было бы более реалистично, например, семантический анализ российских СМИ (только!) или образовательного сектора (только) и т.д. Но уж странички по косточкам разбирать... Только где такие мощности процессорные брать? 

Т.е. грубо говоря - где та ниша, в котрой Гугл неуверенно ищет нужное. Где он глючит постоянно?
Маштабируемость, многоязычность и тд была заложена изначально — это потребуется в дальнейшем. Далее как вы верно заметили будет секторный *семантический анализ. По серверной мощности пока опасений нет — допустим мы с ЦОДом в партнерских отношениях (по другим проектам).

По нише полагаю будет видно к концу 2012, когда будет завершена финальная часть — сейчас только половина пути. Ниша или посещаемость/целевая аудитория по большей части определяется функционалом. Часть функций уже доступна в публичном доступе, часть сейчас остается закрытой и будет открыта поэтапно. Анонсировать пока еще НЕ реализованный (запланированный функционал) в паблик мягко говоря не совсем рационально.

Извините за наивные вопросы. Мне бы очень хотелось, чтобы наши разработчики чем-то наконец выстрелили кроме тетриса... Искренне желаю вам всяческих успехов.

Но, возможно, что прояснение таких вопросов привлекло бы к Вам более серьезный контингент. А до тех пор пока идея формулируется на уровне "теории графов" и "матриц", ... ну не понятно все это, уж слишком наивно выглядит. Как крючок для школьников, которые эти графы чем-то супер умным считает.
Касаемо «теории графов» (дерево) и «матриц» - эта часть добавлена в описание как определяющая основные системные блоки которые собраны в названии домена: matrix, tree, neural network


Спасибо за интересные вопросы, надеюсь ответы дали более полное представление по системе.

Оффлайн gr

  • Пользователь
  • **
  • СПАСИБО: 24
  • Сообщений: 77
  • Карма: 7
    • Просмотр профиля
Большое спасибо за ответы. Судя по ним, Вы на самом  деле подходите к делу серьезно.  Хорошо, что в вашей команде есть квалифицированные люди, которые работают по полной ("с большой буквы").

Пара вопросов, которые мне все же кажутся важными даже для примитивного разговора:
  • Где именно будет применена мощь тысяч или миллионов неквалифицированных разработчиков.  Т.е. в чем именно Ваш козырь оперсорсности?
  • Где проваливаются нынешние поисковики? Какие функции они не выполняют нормально?

Остальное, ниже, - вода.
(нажмите чтобы показать/скрыть)

Оффлайн Michael J Fox

  • КМС
  • *****
  • СПАСИБО: 341
  • Сообщений: 1534
  • Карма: 41
  • Пол: Мужской
  • Best Or Nothing
    • Просмотр профиля
    • Глас Закона | Правовой Портал
Приглашаем желающих принять активное участие в тематическом обсуждении по различным направлениям от дизайна и программного кода до поисковой оптимизации и системного проектирования.

надо бы к вам присоединиться. что то новое всегда что то интересное для меня. хоть я и не профессионал, но опыт получают в труде, надеюсь стану профессионалом в ближайшем времени
« Последнее редактирование: 07-01-2012, 02:52:14 от VoxLex »

Оффлайн mark3000

  • Ветеран
  • *****
  • СПАСИБО: 336
  • Сообщений: 945
  • Карма: 34
  • Пол: Мужской
  • практикующий мечтатель
    • Просмотр профиля
    • INTERASCOPE правильные программы для продвижения Вашего сайта
Eco, я не верю в успех подобного мероприятия, но все равно удачи :)
LINKOSCOP 4 заставьте внутреннюю перелинковку работать на вас. | а здесь я пишу о заработке: 100-монет

Оффлайн gr

  • Пользователь
  • **
  • СПАСИБО: 24
  • Сообщений: 77
  • Карма: 7
    • Просмотр профиля
Но ведь ТС не сформулировал еще, что означает для него "успех". Возможно, что успех - это сделать очередной сотый или двухсотый поисковик, который будет иметь свою аудиторию в десяток тысяч человек.

Вот, например, списочек успешных поисковиков 2011.

(нажмите чтобы показать/скрыть)
Заметьте, что у многих технологии довольно продвинутые... Получили свой кусочек под солнцем. Может и ТС такого успеха будет достаточно - заметьте, что по виду даже в этом огромном списке нет очевидно-российских разработок (кто и что разрабатывал нужно еще изучать, просто ... зачем, если Гугл-Яндекса пока хватает?)...

Что я вижу принципиальным вопросом, способным сделать небольшой переворотик..., это глубокий смысловой анализ текстов. Не просто количественные характеристики семантического ядра сайта или игры в PR, ТИЦ, выдачу, а детальный анализ конкретной страницы. Это в тему будущего у гигантов. Не решенная до сих пор задача, безусловно, стоит в легко масштабируемой выжимке из текста содержимого. То, что делает толковый секретарь референт для босса. SE ближайшего будущего будет это делать. И это - проблема чисто алгоритмическая, нет еще ИИ тут... Такой алгоритм (скорее всего прототипы есть и у нас и за рубежом, но на анализ миллионов страниц они не тянут, в силу сложности) прибьет синонимайзеры, спиннеры, машинные и человеческие реврайты. да и хрумеры отправит на помойку. По этой же причине, ИМХО, многие нынешние направления СЕО (черное продвижение статьями и т.д.) обречены на вымирание.

То, что Гугл движется в этом направлении анализа текстов мне, например, очевидно... Не исключаю, конечно, возможности других направлений - поиск по видео, картинкам, анализ звуков и т.д. В любом случае, по существу SE ведут анализ того, что такое "человек в сети" и что такое "человек". И Фейсбук и Твиттер - шаги в этом направлении. Те, кто продвинутся тут дальше, получат преимущество (которым надо будет суметь воспользоваться).  А делать кальку со старых схем не нужно.  Даже в списке, приведенном выше, видно, что для минимального успеха нужно думать "шире версии из коробки". Все эти "революции" с открытостью алгоритма ранжирования, открытостью кода SE и т.д. это все же кубики внутри коробки. Нужен шаг за. Только тогда будет вероятность успеха "с большой буквы". 

Оффлайн EcoАвтор темы

  • Рекрут
  • *
  • СПАСИБО: 3
  • Сообщений: 14
  • Карма: 1
    • Просмотр профиля
«могли бы найти общий язык с Sevab: профи поймут друг друга  с полуслова. »
Игорь в настоящий момент занят своим проектом, сейчас мы ведем переговоры по нескольким площадкам.

«1. Анонсирование серьезного проекта должно  вестись по-другому. Руководителями площадок - СЕОфорума, Хабра и т.д. Если Вы не можете пока их убедить ... то и наберете соответствующих "разрабов"..., то и отношение получите соответствующее.  »
наберете соответствующих "разрабов", завершите разработку, подготовьте пресс релизы и PR группу — скорее всего так и будет в конце 2012 начале 2013. Сейчас как вы уже акцентировали идет увеличение группы разработчиков. Год назад группа увеличивалась за счет личных предложений необходимым специалистам (закрытое участие), сейчас планово добавлена публичная часть.

Согласен, даже технический анонс мог быть более «парадным». Однако всё зависит от поставленных задач.

«2. Мне кажется грубой ошибкой, что по затраченному времени статистика не ведется.   Работать в пустоту можно одному-двум...»
Статистика не ведется по человекочасам, учёт идет в разрезе код(данные/дизайн) на время. Согласитесь, нельзя считать просто общее затраченное время (складывая например часы кода и часы дизайна) — это достаточно слабый показатель. Работать «в пустоту» не желательно даже одному.

«3. "50-100 часов поддержка" кажется малой»
Тут видимо вы под текущей технической «поддержкой» поняли дальнейшее «сопровождение» проекта — разница между ними составляет несколько порядков.

«4. "с большим опытом разработки/внедрения/сопровождения  промышленных/отраслевых ИТ систем". Это показатель уровня разработчиков, рабочих лошадок,  которые вряд ли имеют опыт организации работы  друг друга. На уровне CEO (Chief Execution Officer),  организации команды, пиар, и т.д. Вас могут переиграть враз.  Впрочем, пока нет конкретики, требовать чего-то бессмысленно.»
Опыт организации работ на весьма высоком уровне, есть сертифицированные pmi pmbok специалисты - так что по командообразованию всё отлично. Подразумевался не только уровень исполнения но и уровень участия/организации/ведения больших проектов.

На уровне PR — согласен, на настоящий момент PR менеджеров нет (как вы успели заметить в п.1). Ближе к конкретике они конечно будут необходимы.

Касаемо СЕО — это достаточно высокая планка, необходимая для выхода в большое плавание в основном в коммерческом секторе.

«5. Никакого соглашения о намерениях нет,  никакого устава, договоренности, ничего пока нет?»
"с большим опытом разработки/внедрения/сопровождения  промышленных/отраслевых ИТ систем", а именно соглашения о намерениях, положение по конфиденциальности и прочие отработанные в других проектах нормативно-правовые документы присутствуют.

«Но как только проект  получит серьезные результаты, вы же, весь Ваш десяток человек,  просто переругаетесь за дележку  славы, денег...  »
Если нет опыта или проект первый (максимум 2,3) — то да, такие ситуации встречаются.

«Более вероятный сценарий: если потенциальная стоимость проекта будет намного выше себестоимости, то перед открытием конкуренты\коммерсанты просто выплатят  руководителям часть вилки, чтобы закрыть\коммерциализировать  проект. Каков механизм, предотвращающий подобное развитие?»
...предотвращающий подобное поглощение? Лицензией, до её публикации внутренними документами.

«6. Вопрос вот какой. Берет Гугл Ваш код, ставит себе на машину. Включает  у себя кнопочку - "поиск с детальным семантическим анализом", вуаля. Массовый пользователь  будет спокойно жать кнопку и получать тот же эффект. Если речь только про новый эффективный алгоритм, то Гугл сумеет сделать все как надо.  »
С кнопочками «убрать рекламу», «убрать продвигаемые/спам сайты» и тд? Кнопочек может быть много и интерпретировать тут можно долго. Речь не только по алгоритмам а как вы многократно замечали в подходе и использовании оперсорса.

«Практика показывает - покупными ссылками можно перебить более релевантную страницу.  Будет ссылочный фактор работать в Вашем ранжировании? »
Будет, вопрос скорее на сколько именно на шкале от 0 до 100.

«Какой функционал прибьет все подобные SEO игры в нуль? А что взамен? Или Вы не атакуете идею SEO?»
Напротив, в системе есть возможность работы (с получением прибыли) и для SEO специалистов. Подробнее об этом пока рано.

«нужно нечто  ИИ подобное. Система, способная ловить и хрумеры и спиннеры, и человеческие реврайты... У вас уже есть такое? »
Это целое направление, по сути подсистема, ей занимается другая (пока не многочисленная) группа разработчиков.

«Ваш поисковик не имеет  модульной структуры?»
Модульная не только система, но и сама архитектура разработки.

«7.  Что касается секретных данных, которые нельзя оглашать... Да  поймите, пожалуйста, все это странно. От кого секреты-то? От дяди Гугла? Он скупает ютубы, он проводит конкурсы, он следит за более менее успешными стартапами, а не за голыми идеями.»
«в чем именно Ваш козырь оперсорсности?»
Я подписывал соглашение о не разглашении и не конкуренции — это обычная, повседневная мера для любых организаций, не говоря уже про ИТ сферу тем более с разработкой. Странным кажется как раз отсутствие таких пунктов. Да и у многих был негативный опыт утечки информации.

«От "конкурентов" - других разработчиков софта, которые могут увести идею?  Так они спокойно к Вам зарегистририруются, и уведут все "секреты". Вы ведь ID не спрашиваете в закрытой части? Или Вы и им не раскроете всей идеи?   »
Не совсем так — разработка информационной безопасности была и есть значимым направлением на которое было затрачено необходимое количество ресурсов.
Дизайн, слоганы, часть не системных блоков — да, скорее всего можно взять в большинстве случаев при минимальных затратах. Уровень архитектуры, ядра/кода закрыт достаточно хорошо, однако это не значит что туда не попасть.
Доступ модульный, по различным направлениям/разделам.

«Где проваливаются нынешние поисковики? Какие функции они не выполняют нормально?»
Козыри или функционал будут опубликованы поэтапно, с 10 по 24 января будут открыты (анонсированы) новые функциональные решения — будет что обсудить.


Ещё раз повторю что это НЕ презентация продукта, коммерческое или инвестиционное предложение для которых характерны затраты/прибыли/прогноз/окупаемость/положение на рынке и тд. Это НЕ участие на конкурсе стартапа где необходимо предоставить максимальную информацию по проекту. Это предложение желающим принять участие в обсуждении и разработке.

Если вы действительно заинтересованы в системе — подождите 2-3 месяца, информации будет больше.

Если вы (судя по части ваших вопросов) заинтересованны в коммерческих показателях то в таком случае лучше подождать как минимум 2013го.

надо бы к вам присоединиться. что то новое всегда что то интересное для меня. хоть я и не профессионал, но опыт получают в труде, надеюсь стану профессионалом в ближайшем времени
Welcome! После праздников (когда все соберутся) будет много интересного.

Eco, я не верю в успех подобного мероприятия, но все равно удачи :)
Спасибо
Но ведь ТС не сформулировал еще, что означает для него "успех". Возможно, что успех - это сделать очередной сотый или двухсотый поисковик, который будет иметь свою аудиторию в десяток тысяч человек.
Так и есть - критерии "Успеха/Популярности" различны: десяток, сотня, одна тысяча человек. Далее сегмент: для одной страны 1-3кк это мало, для другой - это большая часть пользователей сети (на примере стран СНГ). То есть при равной базе успех/популярность может отличаться на порядки.

Заметьте, что у многих технологии довольно продвинутые... Получили свой кусочек под солнцем. Может и ТС такого успеха будет достаточно - заметьте, что по виду даже в этом огромном списке нет очевидно-российских разработок (кто и что разрабатывал нужно еще изучать)
Nigma.ru

Что я вижу принципиальным вопросом это глубокий смысловой анализ текстов. Не просто количественные характеристики семантического ядра сайта или игры в PR, ТИЦ, выдачу, а детальный анализ конкретной страницы.
Детальный анализ страницы/хоста/направления, т.е. одной страницы(элемента) к множеству.

 

Похожие темы

  Тема / Автор Ответов Последний ответ
4 Ответов
633 Просмотров
Последний ответ 31-05-2010, 11:18:05
от Newbie
10 Ответов
1020 Просмотров
Последний ответ 28-06-2011, 08:40:30
от Darimar
5 Ответов
676 Просмотров
Последний ответ 12-12-2010, 14:37:05
от Delorean
1 Ответов
689 Просмотров
Последний ответ 05-04-2011, 02:17:20
от azartan
5 Ответов
1303 Просмотров
Последний ответ 24-03-2011, 15:53:16
от Chiliec
0 Ответов
177 Просмотров
Последний ответ 29-03-2012, 11:48:45
от Юрий Шатилов
2 Ответов
151 Просмотров
Последний ответ 09-04-2012, 16:22:11
от Printing