Рекламное объявление
ì´ ì›¹ì‚¬ì´íŠ¸ì— í™˜ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Что это за язык? Китайский язык? Японский?
Вообще-то корейский. Обнаружение этого вручную заняло бы у меня много времени. К счастью, я нашел несколько очень точных инструментов, которые могут делать это автоматически. Все они перечислены ниже.
Эксперимент: Я тестировал веб-сайты, используя образец текста (1-2 предложения по 8 слов) на следующих языках: португальский, русский, корейский, вьетнамский, итальянский, Турецкий, польский, украинский, азербайджанский, словенский, македонский, голландский, филиппинский (тагальский), греческий, галисийский, чешский, белорусский, финский, татарский и Норвежский.
Всего я протестировал 20 разных языков.
3 инструмента для обнаружения текста на неизвестном языке
1. LangId (сдал 18 тестов из 20, не сдал татарский и белорусский языки)

Плюсы: В целом отличный онлайн-инструмент. Он предлагает базовые функции обнаружения текста, а также у них есть Твиттер и боты для обнаружения электронной почты для еще более быстрых результатов.
Минусы: Их движок основан на Google API, но, похоже, они показывают лучшие результаты, чем детектор Google, описанный ниже. Кажется, они очень хорошо умеют пользоваться вещами. Мне не понравилось, что у них нет собственного уникального алгоритма определения языков.
2. Google Language Detector [больше не доступен] (сдал 17 тестов из 20, не сдал португальский, таглогский и белорусский языки)

Плюсы: У Google один из лучших в мире API для определения языка. Они хороши тем, что вы можете увидеть вероятность того, что результат, который они показывают, будет правдой. Они смогли пройти большинство пробных тестов.
Минусы: Я был очень удивлен, что они не прошли тест по португальскому языку. Кажется, у них есть (надеюсь, временная) ошибка с этим языком. Кроме того, они, безусловно, могут лучше улучшить дизайн страницы.
3. Что это за язык (сдал 11 из 20 тестов, не сдал русский, корейский, украинский, азербайджанский, македонский, тагальский, греческий, галисийский и татарский)

Плюсы: Некоторые языки, такие как южнославянские (сербский, хорватский, словенский), очень похожи. Если вы вводите какой-то хорватский текст, скажем, этот веб-сайт сообщит вам, что текст также может быть сербским или словенским.
Минусы: Им нужно работать над совершенствованием своей системы обнаружения. Я думал поставить Translated.net (другой веб-сайт для определения языка) вместо этого, но Translated обещал обнаружение большего количества языков и на самом деле сделал хуже, чем WhatLanguageIsThis.com.
2 инструмента для обнаружения веб-сайтов на неизвестных языках
4. Google Переводчик с участием Определить язык как первый вариант
Прошедший: 18 из 20 не прошли белорусский и татарский.
Плюсы: Этот инструмент отлично справляется со своей задачей. То, что мне нравится в Google Переводчик Google Translate 2.1: встроенная клавиатура iOS 7 и дополнительная языковая поддержкаОбновите Google Translate 2.1 на своем устройстве iOS и сохраните поддержку перевода и рукописного ввода для новых языков. Google Translate наконец-то получил новую клавиатуру iOS 7, которая делает все ... Подробнее заключается в том, что если он не поддерживает определенный язык, он дает вам следующий экран:

Если вы спросите меня, это отличный детектор языка!
5. Переводчик Microsoft Bing с участием Автоматическое распознавание как первый вариант.

Прошедший: 8 из 20 не прошли голландский, вьетнамский, турецкий, украинский, азербайджанский, словенский, македонский, тагальский, греческий, галисийский, чешский и белорусский языки.
Плюсы: Он поддерживает ограниченное количество языков. Для этих языков он хорошо справляется со своей задачей.
Минусы: Я очень разочарован Microsoft. У них очень ограниченное количество языков для обнаружения и перевод Забудьте о Google Translate: 3 способа получить точный и быстрый переводПланируете ли вы подать заявление о приеме на работу или квартиру за границей или хотите перевести свою веб-страницу, вам нужно делать все правильно даже с иностранным языком. Подробнее и их функция автоопределения ужасна. Если вы укажете язык, который они не поддерживают, вместо сообщения о том, что они не поддерживают этот язык, вы получите неверный результат.
Мысли
В целом, я считаю, что вышеупомянутые инструменты движутся в правильном направлении. В настоящее время они являются лучшими для определения языков в Интернете и довольно хорошо справляются со своей задачей, когда дело доходит до популярных языков. Однако они должны работать над добавлением большего количества малоизвестных языков (ни один из инструментов не смог распознать татарский), и я уверен, что все они, особенно Google, пойдут в этом направлении в ближайшем будущем.
Изображение предоставлено: Канко *
Меня зовут Дарко (ник Даррен). Мне нравится Web 2.0, я создаю нишевые сайты (мой последний проект - поиск людей). и так далее... что еще я могу сказать обо мне в таком коротком профиле, подпишитесь на мой Твиттер, если хотите узнать больше :)