Платформа Google Cloud разом з The New York Times оцифрує понад п’ять мільйонів зображень, що зберігаються в архівах газети, повідомляють у блозі Google Cloude.

Відскановану вручну фотографію, а також інформацію, записану на її зворотному боці, відсилатимуть у хмарний сервіс для автоматичного цифрування та розпізнавання тексту і зображення.

В архівах The New York Times (газета називає їх «моргом») зберігаються від п’яти до семи мільйонів знімків, використаних виданням у своїх номерах майже за весь час існування (із середини XIX століття).

Знімки організовані у вигляді бібліотеки: в архіві є каталог, за допомогою якого можна знайти потрібну фотографію. На зворотному боці деяких з них також міститься інформація про зроблену фотографію та навіть дані про те, в якому номері газети вона з’явилася.

Попри те, що каталог дає змогу досить швидко знайти потрібну світлину, це не дуже зручно, особливо для тих, у кого немає прямого доступу до архівів газети. Для цього видання вирішило оцифрувати архівні зображення із залученням хмарного сервісу Google Cloud: крім сканування самих фотографій, система розпізнає додаткову інформацію, яка може бути записана на зворотному боці знімка.

Для цифрування фото використовуватимуть відкриті алгоритми Cloud Vision API, який застосовують для розпізнавання зображень.

Обкладинка: Wikipedia