Обновить
70.35
Content AI
Решения для интеллектуальной обработки информации
Сначала показывать

PDF с точки зрения программиста

Время на прочтение8 мин
Охват и читатели86K
Я имею дело с PDF не только как пользователь, а, прежде всего, как разработчик софта, умеющего его читать и писать (возможно, вы сталкивались с продуктами компании ABBYY, работающими с PDF – ABBYY FineReader, ABBYY PDF Transformer). Я предполагаю, что вы прочитали статью habrahabr.ru/company/abbyy/blog/105006 и далее пишу только про некоторые особенности и ограничения PDF, которые больше интересны продвинутым пользователям. Никаких сложных технических деталей при этом не буду касаться, так что программистам, желающим научиться читать или писать PDF, лучше сразу перейти к чтению спецификацию версии 1.7 со страницы www.adobe.com/devnet/pdf/pdf_reference_archive.html :)
Читать дальше →

One Definition Rule, inline и неожиданные последствия их сочетания

Время на прочтение4 мин
Охват и читатели14K
C++ требует, чтобы любая функция была определена не более одного раза – One Definition Rule, ODR. Как только вы определяете функцию с одним и тем же именем и сигнатурой в разных единицах трансляции (файлах .cpp), вы получаете индикацию ошибки на этапе линковки.

inline функции обычно определяются в заголовочных файлах (.h), чтобы все единицы трансляции могли видеть реализацию функции и подставить ее по месту вызова. Соответственно, как только вы включите заголовочный файл с такой функцией в более чем одну единицу трансляции, ODR будет формально нарушено, но… никакой индикации ошибки вы не получите.

Почему и какие неожиданные последствия это может иметь?
Читать дальше →

Что такое ABBYY FormReader и как он работает в «Альфа-банке»

Время на прочтение3 мин
Охват и читатели16K
Мы уже довольно много рассказывали о продуктах для разработчиков и для конечных пользователей, но ещё ни разу речь не заходила о решениях для целых компаний. Исправляемся: сегодняшний пост об ABBYY FormReader – системе ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition). А рассказывать о ней мы будем на примере внедрения в «Альфа-банке».
Читать дальше →

Lingvo со вкусом яблок

Время на прочтение3 мин
Охват и читатели12K
imageСвершилось то, о чем вы так долго просили. Встречайте ABBYY Lingvo для мобильных устройств Apple! Это не просто портированная под iOS версия мобильных словарей, которые до этого момента были доступны на WinMobile и Symbian, это продукт, созданный с учетом различных особенностей яблочной платформы. Сегодня мы запускаем версию для iPhone и iPod Touch (для iPhone OS 3.0 и выше), а версия для iPad появится через две недели.

Читать дальше →

Лингволоджи. Кунсткамера

Время на прочтение1 мин
Охват и читатели17K
Поскольку среда — это маленькая пятница (тем более, на этой неделе), представляем вашему вниманию выпуск увлекательного археолого-лексикографического журнала «Лингволоджи», который делает команда Lingvo. Сегодня мы поговорим о действительно странных штуках, населяющих словарь ABBYY Lingvo.

1. Спасибо, Кэп!

image

2. Несомненно, очень нужные в хозяйстве вещи

image

image

Читать дальше →

Локализация мобильных приложений (совместно с Nokia)

Время на прочтение2 мин
Охват и читатели3.7K
Несколько дней назад мы в ABBYY Language Services объявили о запуске масштабного совместного проекта с Nokia, цель которого – оказать российским разработчикам поддержку в локализации своих мобильных приложений и помочь им успешно продавать программное обеспечение по всему миру. Расскажу о том, как возникла идея такого сотрудничества, и что получилось в итоге.

Мобильные приложения, как правило, изначально ориентированы на распространение на глобальном рынке. Этому способствует принятая в отрасли модель распространения – через онлайновые магазины приложений. Для каждой популярной мобильной платформы создана инфраструктура, позволяющая разработчикам продавать программное обеспечение по всему миру. Поэтому взрывной рост количества мобильных приложений в последние 2-3 года привел к не менее впечатляющему росту спроса на их локализацию.
Читать дальше →

28 октября — Международный День без бумаги или как отметить World Paper Free Day

Время на прочтение1 мин
Охват и читатели5.7K
image
Международная ассоциация специалистов в области управления информацией AIIM объявила 28 октября Международным Днем без бумаги (World Paper Free Day), тем самым призывая компании обращать большее внимание на технологии безбумажного документооборота.

В России инициативу AIIM поддержал проект DOCFLOW и приглашает всех желающих стать участниками акции. Начинание самое достойное, и поэтому компания ABBYY с радостью присоединяется к приглашению.

Ни для кого не секрет, что количество информации, иметь дело с которой нам приходится ежедневно, растет в геометрической прогрессии. Некоторые исследования говорят, что в 2011 году объем информационных потоков возрастет в 10 раз по сравнению с 2006-м. И большая часть рабочих документов во многих компаниях, как ни странно, все еще пребывает в бумажном формате. И это несмотря на очевидные преимущества перехода на электронный документооборот и помощь, которую можно оказать окружающей среде, просто реже нажимая клавишу print (тем более в масштабах всей организации).

Международный День без бумаги должен стать еще одним поводом задумываться о необходимости наращивать бумажные потоки, когда есть масса технологий, позволяющих их сокращать.

В День без бумаги DOCFLOW объявляет конкурс инициатив по сокращению расхода бумаги в компаниях!
Условия можно найти тут

А вы сколько раз сегодня уже успели подойти к принтеру?

Свой Google Search – теперь и по сканам документов

Время на прочтение2 мин
Охват и читатели7.5K
Как сделать документы на серверах компании доступными для полнотекстового поиска и при этом сохранить их конфиденциальными? Как получить функциональность Google Search, не вынося сор из избы оставив документы в пределах сети компании? Корпоративный поиск – еще один быстрорастущий вкусный пирог.

Крохотная малоизвестная компания Google предлагает решение в виде красивой желтой коробки для установки в стандартную 19-дюймовую стойку – Google Search Appliance.

Схема следующая:
  • заключаете договор
  • cтавите у себя желтую коробку
  • назначаете ей IP-адрес (доменное имя тоже не повредит)
  • коробка обходит и индексирует документы в сети
  • каждый, кто зайдет браузером по тому IP-адресу, видит точно такую же страницу, как на www.google.com, – там можно давать такие же запросы, так же получать результаты
  • ???
  • СЧАСТЬЕ

Тот же привычный поиск (соответственно, минимум усилий на обучение сотрудников), и документы не покидают сеть компании. Существенное ограничение – файлы изображений в файловых хранилищах (например, сканы документов) для поиска недоступны – GSA не может извлечь из них текст. Хьюстон, у нас проблема.
Читать дальше →

Каждому студенту – по «хомяку»

Время на прочтение2 мин
Охват и читатели13K
image
Пару недель назад вышла облегчённая версия ABBYY FineReader 10 – Home Edition (мы её ласково называем «хомяк»). «Домашняя» версия нашего любимого продукта создавалась на тех же технологиях, что и Professional Edition (возможно, вы уже читали о нём на Хабре), но в ней меньше функций. «Лёгкий» (читай: дешёвый) FineReader 10 уже давно ждала студенческая братия – наконец, дождалась :)

Что умеет этот зверь

Свободный график в цифрах

Время на прочтение2 мин
Охват и читатели13K
Мы уже писали, что тем, кто приходит к нам работать, в качестве одного из приятных условий труда достается «практически свободный график». Почему практически? Во-первых, потому что все-таки надо отрабатывать по 40 часов в неделю (worktime суммируется по месяцам), а во-вторых, потому что есть задачи, которые надо решать во вполне конкретные сроки. И если второе вносит в график работы наших сотрудников более-менее случайные колебания, то первое обстоятельство сказывается на расписании вполне определенным образом. Да, кстати, все это относится только к разработчикам. Сотрудникам русского офиса (занимающегося продажами) приходится подстраиваться под партнеров, и их график совсем не такой гибкий.

Мы проанализировали статистику проходов через турникеты, установленные на первом этаже нашего офиса (именно там фиксируется время прихода и ухода), — и вот что получилось.
Читать дальше →

ABBYYOnline — взгляд архитектора

Время на прочтение10 мин
Охват и читатели6.8K
Сегодня мы поговорим о распределенных, гетерогенных и местами довольно серьезно и разнообразно нагруженных интернет приложениях на примере портала http://www.abbyyonline.com. Я постараюсь не углубляться в технические подробности, имеющие отношение к конкретной платформе, и, хотя основная часть описанного приложения реализована на ASP.Net MVC, возможно, данный материал заинтересует всех, имеющих отношение к веб-разработке, вне зависимости от используемого инструментария.
Читать дальше →

Индустрия перевода уходит в облака

Время на прочтение5 мин
Охват и читатели7.5K
2010 год оказался весьма богат на альянсы между переводческими компаниями и компаниями, производящими лингвистический софт. Мы достаточно подробно писали в блоге ABBYY Language Services о партнерстве IBM и Lionbridge, а также SDL и Language Weaver. Кроме того, в августе были почти одновременно анонсированы еще два союза чуть меньшего масштаба. Sajan подружился с PROMT и планирует встроить машинный переводчик в свою систему управления переводческими проектами. А Milengo объявила о партнерстве с Asia Online (машинный переводчик), Acrolinx (ПО для подготовки текста к переводу) и Clay Tablet (ПО для управления глоссариями и базами Translation Memory). Эти компании собираются интегрировать свои продукты и сервисы в единое решение.

Это не первые подобные альянсы и, очевидно, не последние. На наших глазах ведущие мировые переводческие компании постепенно все глубже вторгаются на территорию разработчиков лингвистических технологий, как в традиционной модели лицензирования, так и в модном ныне SaaS-варианте. Давайте попробуем разобраться, почему это происходит.
Читать дальше →

Словари ABBYY Lingvo на Mail.ru

Время на прочтение1 мин
Охват и читатели5.2K
Lingvo продолжает шагать по планете по просторам рунета. С сегодняшнего дня им могут бесплатно пользоваться все посетители Mail.ru – для этого нужно просто зайти на закладку «Словари». В основе сервиса лежит портальное решение ABBYY Lingvo Web Server с Web API.

image

Что умеет эта штука?

Скреплённые навечно

Время на прочтение3 мин
Охват и читатели2.8K
Обычный день, вы идете к рабочему месту, думая о чем-нибудь хорошем – например, перспективном гаджете вроде седьмого айфона или электрическом велосипеде. Вдруг на полу вы видите…

Нет, не новый микропроцессор с малым тепловыделением, а винт… подозрительно большого размера image

Что бы это значило?

Ближайшие события

Бета-тестирование лингвистического портала ABBYY Lingvo.Pro

Время на прочтение2 мин
Охват и читатели11K
А вот и обещанный сюрприз :)

Компания ABBYY запускает бета-тестирование нового лингвистического портала Lingvo.Pro и приглашает вас принять в нем участие. Чем Lingvo.Pro отличается от привычного вам Lingvo Online?
Читать дальше →

Чем занять процессоры?

Время на прочтение2 мин
Охват и читатели3K
В науке футурологии одним из основных методов является анализ текущих инвестиций в определенные исследования. Футурология исходит из того, что в том, куда никто ничего не вкладывает, никаких фундаментальных изменений можно не предвидеть (хотя, конечно, могут быть неожиданные открытия, которые перепутают все карты, но научно предсказать их все равно невозможно). Соответственно, если куда-то кто-то вкладывается (например, известно, что огромные средства сейчас тратятся на прикладную генетику и микробиологию), то можно с некоторой вероятностью ожидать, что там что-то да получится. Дальше эти ученые идут и спрашивают людей, которые в этих областях что-то делают, какие цели те преследуют и в какие сроки, с их точки зрения, эти цели достижимы. А дальше делают поправку на оптимизм, подключают свое воображение и анализ, и достраивают картину мира, в которой есть то, что к тому времени уже сделали эти люди.

Предлагаю и нам на короткое время заняться любительской футурологией. Мы попытаемся ответить на простой вопрос: куда нас заведет гонка процессоров?

Читать дальше →

ABBYY Business Card Reader for iPhone научился пользоваться социальными сетями

Время на прочтение1 мин
Охват и читатели6.2K


Сегодня мы выпустили третью версию программы ABBYY Business Card Reader для iPhone. Это программа, которая переносит информацию с визитной карточки в адресную книгу телефона (карточку нужно для этого сфотографировать).

Что нового в третьей версии: кроме доработанного интерфейса, появилась возможность узнать о вашем новом знакомом немного больше :) А именно: прямо из карточки контакта поискать о нём информацию в социальных сетях LinkedIn и Facebook и в Twitter. А ещё теперь можно, не выходя из программы, найти на Google Maps адрес компании, в которой работает хозяин визитки.
Как это выглядит

PDF в России – стандарт или не стандарт?

Время на прочтение3 мин
Охват и читатели38K
Почему в России PDF фактически не является стандартом, хотя и имеет статус международного стандарта (закреплён ISO/IEC 32000-1:2008)?

Казалось бы, PDF – признанный на Западе стандарт электронного документооборота, формат удобный, компактный, при открытии файла на разных компьютерах форматирование не ползёт. Программы для просмотра и создания PDF-файлов легко и бесплатно находятся в интернете. И всё же у нас мало используют этот формат. Попробуем разобраться.
Читать дальше →

История Lingvo. Бобер

Время на прочтение2 мин
Охват и читатели14K
Раскапывать историю Lingvo — задача не из легких: программе стукнул уже 21 год! Трудно найти людей, помнящих, каким был тогда Lingvo. Даже наши корифеи — создатели ABBYY — помнят далеко не все. Вы можете не верить, но некоторые из первых версий Lingvo, похоже, навсегда утеряны! Но тем интереснее раскапывать: ни вы, ни мы не знаем, чем же закончатся эти раскопки и что нам встретится по пути.

Первое, на что натыкается юный Lingvo-археолог, — это всегда счастливый и довольный Бобер Lingvo.image
Читать дальше →

Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

Время на прочтение3 мин
Охват и читатели16K
На прошлой неделе мы выпустили очередную версию OCR SDK – продукта для встраивания технологий распознавания текста в различные приложения. Уже в течение многих лет выпуск пользовательского коробочного FineReader’a мы дополняем тиражом кружек и маек выпуском соответствующих технологий в виде SDK – FineReader Engine (для краткости его зовем FRE).

Под катом я расскажу об улучшениях нового FRE по сравнению с предыдущими версиями.
Читать дальше →

Информация

Сайт
www.contentai.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия