Распознование капчи

Тема в разделе "PHP", создана пользователем zerg, 4 окт 2010.

  1. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
  2. zloyweb

    zloyweb Member

    Регистр.:
    19 авг 2010
    Сообщения:
    417
    Симпатии:
    2
  3. leksus

    leksus Супер-модератор

    Регистр.:
    24 авг 2009
    Сообщения:
    466
    Симпатии:
    0
    Ответ: Распознование капчи

    Как было справедливо замечено одним из юзеров античата - сейчас, при существовании антикаптча сервисов, тема с собственной разработкой антикаптч интересна разве что в познавательных целях. Один бакс за 1килокаптч вполне демократичная цена.
     
  4. BongoBongo

    BongoBongo New Member

    Регистр.:
    3 ноя 2010
    Сообщения:
    1
    Симпатии:
    0
    Ответ: Распознование капчи

    У меня была идея насчет создания собственного сервиса по распознаванию капч, но решил этого не делать именно по этой причине.
     
  5. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
    Ответ: Распознование капчи

    А я вот ради спортивного интереса пробовал распознать сложную капчу но процедура не из легких.
     
  6. FFman

    FFman New Member

    Регистр.:
    20 сен 2009
    Сообщения:
    171
    Симпатии:
    0
    Ответ: Распознование капчи

    +1, написал простенькую OCR, заточенную под определенную капчу, вроде работает :yahoo:
     
  7. doggydogg

    doggydogg New Member

    Регистр.:
    5 июл 2011
    Сообщения:
    29
    Симпатии:
    0
    Ответ: Распознование капчи

    А как думаете, реально реализовать скрипт который будет сначала пытаться сам распознать, если нет, то отдавать на распознавание сервису антикапчи?
     
  8. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
    Ответ: Распознование капчи

    doggydogg, ну а что тут такого? Простые капчи распознать не сложно, и можно по разному, к примеру определять вероятность.
     
  9. Uhobot

    Uhobot Moderator

    Регистр.:
    21 фев 2011
    Сообщения:
    149
    Симпатии:
    0
    Ответ: Распознование капчи

    Экокапчер - новое средство для экономии на капче - ваши индусы изнашиваются на 50% меньше! :D
     
  10. stargazerrrrr

    stargazerrrrr New Member

    Регистр.:
    5 сен 2010
    Сообщения:
    130
    Симпатии:
    0
    Ответ: Распознование капчи

    Я помню года два назад тоже баловался с OCR в MatLab, на основе нейросети convolutional neural network (CNN) :pc:. Вот ссыль, если кто чувствует в себе достаточно энтузиазма:
    [HIDE="1"]http://www.mathworks.com/matlabcentral/fileexchange/25247-mycnn[/HIDE]

    Простые капчи типа phpBB пробивал с вероятностью около 90%.

    Правда потом мне стали все чаще попадаться капчи на основе матерого js типа "перевернуть слоника" и я, трезво оценив все за и против, решил платить 1$/1000 :).
     
    Последнее редактирование: 10 сен 2011
  11. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
    Ответ: Распознование капчи

    stargazerrrrr, недавно на яве изучал вопрос, что хочу сказать очень много всего. И нейронные сети и готовые OCR библиотеки. Понравилась больше всего Asprise OCR Java.

    Пример:
    [​IMG]
     
  12. stargazerrrrr

    stargazerrrrr New Member

    Регистр.:
    5 сен 2010
    Сообщения:
    130
    Симпатии:
    0
    Ответ: Распознование капчи

    Ну это здорово конечно, что есть либа под яву.

    Но ты представляешь себе реальный объем работ? Посмотри на историю хрумера, они каждый вид капчи считай отдельно прикручивали. А видов их тьма!

    Разве что самые популярные (типа рекапчи) самому распознавать, а остальное на сторонние апи ...
     
  13. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
    Ответ: Распознование капчи

    Ну так то тут тема про распознавание капчи а не про спам. Цели могут быть разные.
     
  14. MyxPyM

    MyxPyM New Member

    Регистр.:
    27 июл 2011
    Сообщения:
    55
    Симпатии:
    0
    Ответ: Распознование капчи

    Я встречал

    Программы декодеры каптчи:

    PWNtcha - captcha decoder

    что про данную программу можете сказать стоит ли её юзать, и ещё интересует если рабочие скрипты распознавания каптчи
     
  15. stargazerrrrr

    stargazerrrrr New Member

    Регистр.:
    5 сен 2010
    Сообщения:
    130
    Симпатии:
    0
    Ответ: Распознование капчи

    Ну я хрумер просто в качестве примера привел. Своим постом я хотел только сказать, что в одиночку без команды такое не потянуть. И комманда тут нужна не 2 человека а около 4-6.

    Вообще автоматизация работы с веб-приложениями может приобретать оттенок спама, а может и нет - смотря какие цели и задачи. И тот же хрумер можно использовать для вполне мирных почти пушистых целей.
     
    Последнее редактирование: 13 сен 2011
  16. MyxPyM

    MyxPyM New Member

    Регистр.:
    27 июл 2011
    Сообщения:
    55
    Симпатии:
    0
    Ответ: Распознование капчи

    С чего вы взяли что нужна команда чуть ли не футбольная. Это же вам не игру создавать. А насчёт Хрумера да там работает команда, но она тоже заказывает у програмиста, разгадывание каптчи просто стоит это не дёшево. Данный скрипт может написать и 1 толковый программист, если он знает своё дело.
     
  17. stargazerrrrr

    stargazerrrrr New Member

    Регистр.:
    5 сен 2010
    Сообщения:
    130
    Симпатии:
    0
    Ответ: Распознование капчи

    Понятно, что может. Просто у меня еще живо воспоминание о том веселом времени, которое я проводил за чтением занимательных научных публикаций о нейросетях (которые доступны только на английском), а также время, потраченное на освоение доступных реализаций на cpp, lisp, matlab и т.д., выбор наиболее подходящей, копание в ней. Плюс допиливание указанной в ссылке либы хотя бы до состояния возможности распознавания капч с phpBB и других простейших число-буквенных капч с рандомным количеством символов и незначительным количеством шумов/помех.

    Конечно это было все очень интересно в то время, но учитывая что помимо разгадывания капчи надо еще огромное количество нетривиального функционала разработать, то эта задача (по крайней мере для меня) отошла на третий план.

    Если бы была команда, то все воспринималось бы в другом цвете. Но где те джедаи, готовые окунуться в столь долгое путешествие на одном голом энтузиазме? У меня к примеру уже есть горький опыт работы в "команде", где в итоге через 3 месяца всю ношу тяну фактически один я.
     
  18. zerg

    zerg Administrator Команда форума

    Регистр.:
    18 июл 2008
    Сообщения:
    4.254
    Симпатии:
    3
    Ответ: Распознование капчи

    Я тоже собственно считаю что 1 тут не просто не напишешь а просто смысла нету. Потому как сам спам не вечен, и наверное каждый мечтает от этого уйти заработав на создание нового проекта. Нужно во всем что только можно использовать готовое, бесплатное, время такое что все очень быстро развивается. Без команды делая что-то серьезное далеко не уедешь.

    Вот к примеру биржи ссылок, по сути код 1. Если бы делала команда 3 человека то они бы могли сразу каждый сам себе запустить по бирже. Конкуренция была бы большой и собственно туда бы уже не всякий лез. И конкурировали бы только между собой.
     
  19. andriyandr

    andriyandr New Member

    Регистр.:
    11 мар 2012
    Сообщения:
    1
    Симпатии:
    0
    Ответ: Распознование капчи

    я пишу программу распознавания цифр на вагонах. Возник вопрос каким образом можно разделить прямоугольник с цифрами на отдельные части, если расстояние между цифрами разное (бывают даже соединены)
     
  20. BestProxies

    BestProxies New Member

    Регистр.:
    10 авг 2012
    Сообщения:
    7
    Симпатии:
    0
    Ответ: Распознование капчи

    1. Приращиваем ширину считываемого прямоугольника на один пиксел.
    2. Пытаемся распознать в полученном прямоугольнике символ.
    2а. Если символ распознался, приращиваем счетчик сдвига от начала на его ширину и переходим к пункту 1.
    3. Переходим к пункту 1.

    Наверное как-то так.
     

Поделиться этой страницей