Представляем очередной авторский обзор расширения в рамках нашей акции.
Наверняка у многих было так: открыв статью, смотришь на ее длину и откладываешь прочтение на потом. А дело в том, что автор замаскировал свою главную мысль за огромным количеством незначимых слов. В итоге статья так и остается непрочитанной. Поэтому мы и придумали Juisy — расширение для Google Chrome, которое помогает читать только самую суть.
Мы хотели создать решение, которое позволило бы быстрее читать, не откладывая на потом и не умножая количество вкладок в браузере. В основе работы Juisy — технология анализа текста, определяющая наиболее «тяжелые» по смыслу фрагменты.
Мы знаем, что решения, подобные нашему, уже существуют. Но они имеют два серьезных минуса. К сожалению, большинство из них хорошо работает только с английским языком. И второй существенный недостаток — они очень сложны для решения повседневных задач. То есть требуется выделить нужный текст, скопировать его, зайти на сайт, вставить текст в форму, нажать кнопку… Поэтому мы сделали расширение для браузера — чтобы сокращать любой текст на любой странице.
Основная сложность при разработке была связана с автоматизацией определения контента на сайте. Вы сами хорошо представляете, сколько сайтов в сети, все они разные, а многие из них еще и пытаются как-то особенно выделиться. Формально «достать» текст с web-страницы легко, но, например, выделить текст, относящийся только к статье, — уже нетривиальная задача. При этом качество выявления контента играет ключевую роль в качестве работы алгоритма. «Мусор» с сайтов (меню, реклама и так далее) нам не нужен.
Возможно, мы совершили ошибку, пытаясь создать универсальный граббер контента. В ближайшем будущем постараемся для каждого сайта писать специализированные анализаторы контента, начнем с самых популярных. Конечно, все мы покрывать не собираемся, но думаем заточить наш граббер, по крайней мере, под 1000 сайтов рунета.
Сердце дополнения — это наш сервис, который анализирует текст и определяет, что, на его взгляд, вам стоит прочесть. Мы используем комплексные технологии анализа естественного языка. Пока мы не можем похвастаться, что сервис работает безупречно. Но наша команда каждый день работает над ним, делая его умнее.
На нашем сайте вы можете посмотреть, как работает эта технология. Либо установить расширение из Chrome Web Store.
Мы будем очень рады любым вопросам, замечаниям и предложениям. Ждем их на info@juisy.in или здесь в комментариях.