Чужой кейс: c 0 до 130 000/сутки на авто-переводном контенте

Сегодня хочу начать новую рубрику в своём блоге — интересные кейсы. Кейсы будут по большой части чужие (их всё таки больше), основанные на моих наблюдениях. Уже отложил себе пачку интересных сайтов которые используют нестандартные или интересные методы продвижения. Надеюсь, что начну постепенно выкладывать их в блог. Поехали!

Первый кейс — сайт, у которого вообще нет «уникального» контента и собирающего по 130 000 визитов в сутки. Наблюдаемый — http://qaru.site.
Вы только посмотрите на этот замечательный график роста трафика! Можно заваривать чаёк с лимоном и спокойно на него любоваться 10 минут:

Основная аудитория сервиса — разработчики. Как профессионалы, так и любители. Основной контент сайта — ответы на вопросы пользователей по различным областям программирования. И если вы хоть раз в жизни пытались что то разрабатывать сами, или видели чужой процесс разработки, то должны понимать — очень значительную часть времени при написание кода занимает именно поиск различных решений в интернете («как в php сложить две строки», «python библиотека для распознования лиц» и т.д.). Т.е. трафика в этой нише очень много.

Сайт парсит вопросы и ответы с самого популярного QA-сайта для разработчиков — stackoverflow.com. Сам Stackoverflow конечно же на английском, поэтому после парсинга все тексты прогоняются через Google Translate. Это легко проверить сделав поиск по конечной части урла любого запроса. Создатели сайта его не переводят, и он выглядит примерно так: «http://qaru.site/questions/1/why-is-it-faster-to-process-a-sorted-array-than-an-unsorted-array». Вбиваем в Google запрос, и получаем тот самый stackoverflow на первой же строке. Да и сам вопрос уж больно похож на свой русскоязычный аналог 🙂

Должен заметить, что у сайта переводятся не только сами вопросы, но и ответы на них. Так же перекачиваются все картинки. Многие элементы оформления так же сохранены (подзаголовки, разделение, форматирование текста и др.).

Почему же это работает?

Многие опытные вебмастера хорошо понимают, что контент просто переведённый через Google Translate не всегда так охотно заходит в индексе. Давайте рассмотрим причины, почему этот паровозик смог:

  1. Лексически-семантическая особенность технических текстов. Если вы пройдётесь по некоторым страницам вопросов и ответов на этом сайте, то заметите, что они читаются без напряжения. Такие «лёгкие» для чтения тексты очень не свойственны при автоматическом переводе. Если вы попробуете перевести текст любой другой тематики с английского на русский, то заметите, что очень часто ломается сама конструкция предложений — их становится трудно читать, приходится вдумываться, в голове изменять порядок слов в предложении.
    Лексически-семантические особенности технических текстов, к ним можно отнести тексты с stackoverflow, при переводе на с английского на русский (и скорее всего ещё на несколько других языков) позволяют хорошо сохранить как конструкцию предложения, так и связь между отдельными словами в предложении.
    Если смотреть на такие тексты «глазами» поисковых систем, это так же несёт в себе большое количество плюсов: начиная от того, что он не содержит спамных конструкций, до хороших показателей TF-IDF для слов в документе (много специфических терминов).
  2.  Длина контента. Помимо самих вопросов (которые иногда достигают длины в несколько абзацев), на каждой странице показывается большое количество ответов.
  3. Решение задачи пользователя. Данный пункт от части опирается на первый пункт — эти тексты хорошо читаются. Кроме того, что они хорошо читаются, они ещё и решают задачу пользователя. Сотни тысяч профессионалов со всего мира оставляют свои ответы на вопросы пользователей stackoverflow.
    Поэтому когда пользователь заходит на qaru.site, то видит не только хорошо читаемые тексты, но и действительно качественные и полезные ответы (в большинстве случаев). Согласитесь, вероятность того, что в Рунете у какого то сайта будет более качественный ответ, чем на stackoverflow довольно таки малы.
    Поэтому пользователи своими кликами, временем прибывания на сайте и другими действиями чётко показывают поисковым системам — этот сайт решает их потребности.
    Уверен, этот фактор очень значителен в данном кейсе.

Показатели сайта

Регистрация домена — февраль 2017 года
Первый снимок вебархива — 3 июня 2017 года
Страниц в индексе Яндекс — 3 000 000
Страниц в индексе Google — 2 210 000
В индексе Яндекс Картинок — 142 000
В индексе Google Картинок — 119 000

Ссылающихся доменов по LinkPad — 13
Ссылающихся доменов по Megaindex — 115
Ссылок по Megaindex — 800

TrustFlow — 11
CitationFlow — 29

Показатели за последний месяц:

Предполагаемый месячный доход, при трафике 100 000 в сутки от 300 000 до 600 000 рублей.

Траффик по дням за последний месяц:

69,5% поискового траффика приходит из Google, 24% из Яндекс. Общеизвестный факт подтвердился снова — большинство разработчиков пользуются Google 🙂

Сколько такой сайт может зарабатывать?

  • Сайт монетизируется только контекстной рекламой (Яндекс Директ и Google AdWords)
  • Рекламные блоки выбраны и расставлены не оптимально — почти все блоки медийные.
  • Предполагаемый доход за 1000 показов 100 до 200 рублей.
  • Предполагаемый месячный доход, при трафике 100 000 в сутки от 300 000 до 600 000 рублей.

Всё ли так просто?

Нет. Сайт не очень то укладывается в парадигму большинства вебмастеров — поставил WordPress, поставил плагин и парсер => PROFIT. На рассматриваемом сайте отлично реализован парсинг не только текста (и его перевод), но так же форматирование, кол-во голосов у каждого вопроса и ответа, теги и многое другое. Дьявол кроется в мелочах.

Как знания из данного кейса можно вынести для себя?

  1. Поисковым системам важно, чтобы была решена задача пользователя. Даже несмотря на методы — по сути, в данном случае имеет место быть воровство контента. Разработчики поисковым систем думают в том числе в парадигме — не найдет у нас, найдёт у конкурента.
    Думаю многие слышали про внутреннюю метрику Яндекса «счастье пользователя». Уверен, нечто похожее есть и у Google.
  2. Контент с автоматическим переводом всё таки имеет ценность в некоторых ситуациях. Вы можете повторить данный кейс или с другим англоязычным сайтом с техническим контентом, или вообще с другой тематикой.
  3. Уверен, что данный кейс можно повторить и с другими языками. Например, я заметил, что никто не сделал сайт с авто-переводом stackoverflow на немецком. А цена клика в AdSense под DE выше 🙂

Что думаете о данной кейсе? Если у вас есть похожие примеры — присылайте 🙂


Комментарии:

Саша красава! Вот это годный кейс, а не статейники по пузату клепать!

Отличный кейс, по возможности пиши больше о таких, у меня вечно недостаток идей 🙂

Чувак. Ты тот, кто раньше вел блог и запускал сервисы под ником Bormaley же?

    Нет! Я не Бормалей.
    Под фамилию подходит конечно, но я не он 🙂

хороший трафорост!

Всем привет из qaru.
Но с доходом вы очень ошиблись. Раз в пять переоценили.

    Жаль, что ошиблись! 🙁
    Мне кажется если «пошаманить» с блоками, получится увеличить.

Но в целом Александр, видно что вы отличный профессионал. Все четко играмотно описали

Отличное наблюдение.

Да уж, есть такие «полезные сайты». Я попытался найти ответы на свои вопросы «как сложить два нуля на ПХП» на таких сайтах, их много. Нифига не понятно после гуглтранслейта. Как результат, я лично теперь в поиске гугла перехожу только на стэковерфлоу, а это переводное дерьмо обхожу стороной.

Этой аудитории не до рекламы. Если допа в мыле, обычно сосредоточен только на проблеме.

И что касается сложности — все много сложнее в реализации этой задумке чем вы описали.

Что касается воровства — все строго по правилам самого stackoverflow.

    «Воровство» — имел ввиду больше не морально этическую сторону, а именно то, как это видят поисковые системы.

    Про сложность — даже не сомневаюсь, что всё намного сложнее 🙂

Бармалей ? )))

да супер, но все таки Путин ЧМО

«Но с доходом вы очень ошиблись. Раз в пять переоценили.» — вот это порадовало) Всегда радуют такие подсчеты на коленке) По точности они примерно как оценка трафика из similarweb — то есть вообще тупо не о чем, погрешность там может доходить до 50%) И тем не менее куча народу на эти высосаные из пальца метрики дрочит…

    1. Доход я брал по минимальному и максимальному значению известным мне похожим по тематике сайтам. Не учёл, что здесь действительно люди на столько увлечены проблемой что нацелены только на нужную им информацию на странице.
    2. По SimilarWeb — чем больше у сайта трафика, тем ближе оценка у SW. Соответственно, чем меньше — тем больше погрешность.

Годно, очень годно. Не плохая идея для реализации.

Вероятно мой пост из блога в тг который я пропиарил среди дорвейшиков дошёл до тебя с опозданием в месяц 🙂 там я ещё правда технические особенности этого дела раскрыл

Если у тебя есть симилярвеб и ты умеешь искать, то и не такие сайты найдёшь. Есть примеры с выстрелом намного больше. Одно но, почти все они имеют трафик ниже, чем показывает св, иногда сильно ниже чем в два раза. А расчёт даже наш любимый 100-200₽ на 1000 почти всегда мимо. Любые сайты на генеренке и готовых БД почти всегда затрагивают аудиторию где копейки по деньгам. Доходит до смешного 70₽ на 1000. А это доход на обычном сидже по адалту, где даже такие трафа и роста показатели это копейки. Возникает вопрос, зачем вся эта возня? Интересные сайты? Да, Доходные? Нет

>Первый кейс
Я так понимаю, что на подходе ещё второй кейс?

    Да, в планах есть. Надеюсь и время под это дело найдётся.
    Подготовка кейса занимает не мало времени 🙂


Оставьте комментарий