BiGo Software©
Intelligent Computer Go (Baduk, Weiqi) Products

BiGo OCR FAQ

  English pages
  Домой
  Программы
    BiGo Assistant
BiGo Joseki
    BiGo OCR
 

FAQ
  Загрузки
  Цены
  Заказ
  Го
  Форум BiGo
  сайт УФГО

 

 

 

0. Когда я запускаю программу появляется пустое поле с меню наверху. Как зарегистрироваться? Нужен какой-то ключ. Где его брать?
1. Я отсканировал страницу из журнала и запустил распознавание. Программа выдала ошибку. Что делать?
2. Для диаграмм слишком много опций. Как с ними разобраться?
3. Наверное, для распознавания главное - это опции из 'Options -- Game Recognizing', не правда ли?
4. Линейный ввод. Как им пользоваться?
5. Что такое "Add moves mode" и "Edit moves mode"?

6. Почему вы пишете только о японской или корейской Го литературе. Что можно сказать о распознавании диаграмм из других источников.
7. На каких вообще печатных источниках проверялась программа распознавания?
8. Как правильно настроить опции сканера?
9. Не могли бы вы привести пример распознавания от начада до конца?
10. А если при распознавании встретились ошибки. Что делать?
11. Как же все-таки получить партии в формате SGF?


0. Когда я запускаю программу появляется пустое поле с меню наверху. Как зарегистрироваться? Нужен какой-то ключ. Где его брать?

Отвечаю по порядку. Пустое поле с меню наверху - это так сейчас выглядит программа. Пустое поле - для картинки партии, а меню - для работы.
Регистрация программы бесплатна и зарегистрироваться довольно просто. Читайте. Там же есть ответ и на последний вопрос.
Но, кстати, все функции программы, кроме записи работают и без регистрации.

1. Я отсканировал страницу из журнала и запустил распознавание. Программа выдала ошибку. Что делать?

Dia. 1

Dia. 2

Эта версия программы не может автоматически выделять нужные изображения на картинке. Вы должны предварительно вырезать ту часть страницы, где находится диаграмма.
Полная отсканированная страница изображена на Dia. 1. (Пример взят из корейского ежегодника бадук 1989 года). С таким изображением программа работать не может.
После появления сканированного изображения в окне программы включается авитоматически инструмент 'Crop' (вырезка). Просто выделите при нажатой левой кнопке мыши область с одной диаграммой, а затем отпустите кнопку. Если область выделена правильно, то на вопрос программы 'Crop image?' ответьте 'Yes'. Инструмент работает пока довольно неудобно, потому что изменять выделенную область после того как вы отпустили кнопку мыши вы не можете. Инструмент 'Crop' активизируется из меню или при нажатии Ctrl+R.
Если вам удалось выделить изображение с нужной диаграммой, вы получите нечто похожее на Dia. 2.
Эта картинка уже поддается распознаванию, если у вас правильно установлены опции распознавания (Options -- Options -- Game Recognizing) и опции диаграммы (Options -- Options -- Diagram).
Несколько слов о качестве сканирования. Картинка не должна быть ни очень бледной, ни очень темной. При масштабе изображения 1:1 (Image--View--Actual Size) на экране должны быть хорошо видны контуры белых камней. Необходимо правильно настроить опции сканера.

Дополнительную информацию по данному вопросу вы можете найти в:
Пример распознавания партии.

Загрузите страницу c BMP фалами Dia. 1-Dia. 2 и попробуйте распознать партии, которые на ней находятся (см. Вопрос 10). На самом деле это не самые простые для распознавания партии. Если внимательно присмотреться, то можно увидеть что многие камни на диаграмме расположены не ровно, а со сдвигом по вертикали друг относительно друга.

 

 

2. Для диаграмм слишком много опций. Как с ними разобраться?

Да и разбираться особо не надо. Если вы хотите распознавать партии, то просто ничего не трогайте. Все настроено с самого начала.
Если же у вас диаграмма - не полная доска 19 x 19, то вы должны рассказать программе что эта диаграмма из себя представляет, так как автоматическое определение размеров диаграммы пока не работает.
Переключатель Board Part определяет часть доски. Это может быть:
Full board - полная доска
Half board - половина доски
Corner - угол
Arbitrary part - произвольная часть доски
Auto - не работает.
В зависимости от того какую часть доски вы выбрали, включаются соответствующие группы кнопок. Мы не будем подробно рассматривать их, потому что функции понятны из названий.
Переключатель 'Dias per image' в этой версии программы не работает, так как диаграммы для распознавания все равно нужно вырезать вручную.
Внизу справа, в окошке показаны для контроля величины размера доски и пр., которые вы выбрали.


3. Наверное, для распознавания главное - это опции из 'Options -- Game Recognizing', не правда ли?

Это правда. От того, как вы выставили эти опции зависит будет ли программа вообще распознавать диаграмму и как быстро.
Пойдем по порядку.

Number of moves. Количество ходов в партии. Необязательный параметр при распознавании и крайне желателен в режиме линейного ввода.

Add stones in the beginning (old games). Используется крайне редко, когда нужна начальная расстановка камней, как в старых китайских или японских партиях. В этой версии программы не работает.

Handicap. Количество фор в партии. В этой версии программы не работает.

First move. Цвет первого хода на диаграмме.

Number of diagrams for the game. Один из самых важных параметров. Задает количество диаграмм из которых состоит партия.

Game numbering. Это важный параметр для партий из нескольких диаграмм: описывает как нумеруются ходы на диаграммах. Если вся партия помещается на 1-й диаграмме, этот параметр, естественно, теряет свою важность. Game numbering имеет такие значения:
Each dia - from 1st move: нумерация каждой диаграммы начинается с 1.
Continuous: продолжение нумерации, т.е. номер первого хода на следующей диаграмме на 1 больше чем последнего на предыдущей.
Continuous - 100: как только номер переходит через сотню, первая цифра - число сотен отбрасывается.

Dia #. В общем-то справочный параметр. Показывает номер последней распознанной диаграммы, если партия состоит из нескольких диаграмм.

1st move #. Номер первого хода на диаграмме.

1st move in Dia corresponds ХХХ move at the game. Устанавливает соответствие между ходом №1 на диаграмме и реально в распознаваемой партии.

Type of source dia. В разных книгах и журналах камни на диаграммах разного относительного диаметра. В японских источниках почти всегда есть заметный промежуток между камнями, т.е. диаметр камня существенно меньше, чем размер клетки диаграммы. В корейских книгах и журналах по бадук камни часто почти сливаются друг с другом, их диаметр практически равен размерам клетки. При неправильном задании этого параметра, распознавание будет происходить немного медленнее и, возможно, с большим количеством ошибок. Его значения: Japanese Yearbook (small stones), Korean Yearbook (big stones) или Auto.

Выключатель Thin digits (like Korean 2000 Magazine). В некоторых диаграммах (как например в корейских журналах "Бадук" за 2000 год, используются очень неудачные шрифты, цифры в которых тонкие и неконтрастные. Такие диаграммы программа распознает не очень хорошо. Для улучшения качества распознавания попробуйте включить Thin digits. Для обычных диаграмм (в том числе и Dia. 1,2, 3) этот выключатель должен быть выключен!

Выключатель Use Stone Size from Previous Recog Game. Программа работает таким образом что сначала средний определяет диаметр камней. Если вы распознаете несколько диаграмм одинакового размера подряд, то вы можете облегчить участь программы, уменьшить время и улучшить качество распознавания, если после распознавания первой из серии таких диаграмм включите его. Обязательно выключайте Use Stone Size from Previous Recog Game, если размер текущей диаграммы отличается от предыдущей распознанной!

Use Stone Size from Previous Recog Dia for current game. Он действует при распознавании серии диаграмм из которых состоит одна партия. Все вышесказанное относится и к этому выключателю, только его действие не распространяется на первую диаграмму следующей партии.

 

4. Линейный ввод. Как им пользоваться?

BiGo OCR работает как простой редактор Го диаграмм. Реализованы два режима ввода партий: традиционный ввод по ходам и линейный ввод. Переключение между режимами осуществляется из меню (Linear Input -- Start Linear Input). Если этот элемент меню отмечен "птичкой", значит программа находится в режиме линейного ввода, если нет, то - в режиме обычного ввода.
Кроме того, в режиме обычного ввода есть еще два режима: "Add moves mode" - режим добавления ходов и режим редактирования ходов - "Edit moves mode".

Итак, когда вы выбрали в меню Linear Input -- Start Linear Input, появляется окно линейного ввода опций.
Необходимо выбрать какую вы партию собираетесь вводить. По умолчанию установлено, что новую. Кроме того, вы можете переключиться в режим линейного ввода текущей открытой партии (кнопка Use current game) или сказать, что будете продолжать ввод партии с которой уже работали раньше (кнопка Open game).

Выключатели.
Jumps Over Stones - по умолчанию включен. Переключается из меню Linear Input -- Jumps Over Stones или нажатием Ctrl+J. Определяет режим движения курсора на доске. При включенном курсор перепрыгивает через стоящие на доске камни и может двигаться только по пустым пунктам. При выключенном - курсор на доске двигается по всем пунктам.
Show numbers. При включенном на доске показываются номера ходов на камнях, при выключенном - только белые и черные камни без номеров. По умолчанию включен.
Auto replace moves. Автоматически перемещает ранее введенный камень с в текущую позицию курсора при совпадении номеров. При выключенном - запрашивается подтверждение. По умолчанию выключен.
Smart enter. Быстрый ввод разрешен. При известном количестве ходов в партии программа по уже введенным цифрам часто может определить, что вводить для этого хода уже ничего не нужно (например, если в партии 227 ходов, а введены цифры 3 и 4, то программа понимает, что это ход 34, так как при вводе следующей цифры номер хода превысит количество ходов в партии). И здесь курсор автоматически переходит на следующий пункт для ввода номера следующего хода. Если вам нужно ввести, например, ход 12, то программа в этом случае не может определить завершение ввода и вы должны указать, что ввод текущего хода закончен, нажав клавишу "Enter" (или "Пробел"). Если вы хотите ввод каждого хода подтверждать нажатием клавиши "Enter", отключите возможность Smart enter. По умолчанию - включено.
Beep on place stone. По умолчанию включено. При завершении ввода хода звучит сигнал.

Движения курсора на доске.

  • Кликните в любом месте доски и туда переместится курсор.
  • Стрелки на клавиатуре передвигают курсор в соответствующем направлении.
  • Shift+стрелка и Ctrl+стрелка двигают курсор на 5 и 10 пунктов.
  • Нажатие на "Enter" завершает ввод номера хода и перемещает курсор на один пункт вправо, а следующее нажатие перемещает курсор в начало следующей строки.
  • Клавиша "Пробел" завершает ввод номера хода и перемещает курсор на один пункт вправо, следующее нажатие перемещает курсор еще на один пункт.

5. Что такое "Add moves mode" и "Edit moves mode"?

В режиме обычного ввода партий вы можете просто вводить ее ход за ходом (вставка пропущенных ходов пока невозможна :(, так что будьте внимательны). Для входа в этот режим вы должны включить "Add moves mode" в меню "Game" (клавиатурное сокращение Ctrl+A). Это совершенно стандартный режим и объяснять тут нечего.

Режим "Edit moves mode" включается из меню "Game" (клавиатурное сокращение Ctrl+E). В этом режиме последний оставленный камень можно перенести в произвольное место доски. Он используется, если вы, например, ошиблись при последовательном вводе. Просто нажмите Ctrl+E, поменяйте ход, нажмите Ctrl+A и продолжайте вводить или просматривать партию.
Но главное назначение этого режима - исправление ошибок распознавания и линейного ввода, а также ввод ходов, которые на диаграммах не появляются, а отражаются в сносках: ходов на месте сбитых камней, в частности ко-борьбы. Дело в том, что при линейном вводе или распознавании партии некоторых ходов просто нет на диаграмме, т.е. в последовательности ходов они есть но записаны как пропуск хода (пасс). При просмотре партии (обычный режим) найти такой ход очень просто. Нажмите Ctrl+M (Game -- Go to next Mistake) и на доске появится позиция к моменту такого хода. Достаточно теперь кликнуть мышкой на пункте, где сделан этот ход. Снова нажмите Ctrl+M и появится позиция где снова ход пропущен. И так далее. Когда пропусков хода больше не будет, на досске появится окончательная позиция. Вы можете проверить всю партию на наличие пропусков еще раз, нажав клавишу Home: на доске - начальная позиция (для партии без фор - пустая доска), а затем Ctrl+M. Если появится финальная позиция, значит пропусков ходов нет.

6. Почему вы пишете только о японской или корейской Го литературе. Что можно сказать о распознавании диаграмм из других источников.

Почти все китайские книги очень плохого качества печати и BiGo OCR с ними пока не дружит. Что касается другой Го литературы, то записей партий там очень мало и качество распознавания нужно проверять в каждом конкретном случае.

7. На каких вообще печатных источниках проверялась программа распознавания?

BiGo OCR практически идеально распознает партии из японских ежегодных сборников партий изданных в последние десятилетия, вплоть до ксерокопий этих книг хорошего качества.
Корейские ежегодники Бадук распознаются очень хорошо.
Кроме того, хорошо распознаются партии из:

  • японских журналов "Кидо" "Иго клуб" и др.
  • японских газет "Go Weekly"
  • японских книг
  • корейских журналов "Бадук"

Очень плохо распознаются партии из китайских ежегодников по вейчи.

8. Как правильно настроить опции сканера?

Disable Twain dialog. Выключает появление стандартного диалогового окна сканирования. По умолчанию включен. Если вы выключили Disable Twain dialog, то не забудьте в стандартном диалоге установить черно-белое (1-битное) сканирование (другое название - Line Art). Во включенном состоянии этот режим устанавливается автоматически.
Brightness. Яркость. Вы должны знать как наилучшим образом установить яркость у вашего сканера.
Scanned region (inches). Устанавливает область сканирования. Все размеры даны в дюймах (1 дюйм = 2,54 см.).
Resolution. Разрешение. По умолчанию установлено 300 точек на дюйм. Это стандартное разрешение, подходит почти всегда. Если диаграммы маленькие, попробуйте установить 400-500 точек на дюйм. Но не переусердствуйте. Излишнее разрешение очень сильно увеличивает время распознавания. Впрочем, очень низкое разрешение сильно влияет на качество распознавания.

9. Не могли бы вы привести пример распознавания от начала до конца?


Диа. 3

Диа. 4


Диа. 5

Да, это хороший вопрос. Давайте так и сделаем.
Рассмотрим довольно простой пример: партия состоит из 1-й диаграммы. Возьмем для этого партию из японского ежегодника "Кидо" за 1984 год (1-я партия на стр.131) Вот эта партия, уже отсканированная и вырезанная из страницы. Перепишите себе zip файл полноформатной картинкой, распакуйте и откройте программой BiGo OCR (File -- Open Image).
Обратите внимание, что страница в сканере лежала не очень ровно и диаграмма оказалась немного под наклоном. Такой угол еще допустим, больше - хуже. Лучше поправить книгу и пересканировать изображение.
Предположим, что перед этим вы распознавали диаграммы других размеров. Тогда в опциях нужно выключить все что касается размеров камней и выбрать источник - японский ежегодник. Все это показано на Диа. 4

Теперь зайдем в меню Recognition и запустим AutoRecognition (клавиатурное сокращение Ctrl+R). Программа начнет распознавание.
Сначала она пытается найти углы доски. Но здесь один угол занят. Поэтому у нее получится распознать только 3 угла, о чем она вам сообщит и спросит что делать пытаться продолжать распознавание или нет. В данном случае скажите ей, чтобы она распознавала дальше. Однако в других случаях, программе может потребоваться помощь. Тогда ответьте нет и перед повторением распознавания отметьте точки где должны быть углы вручную: Image -- Pointing corners manually (Ctrl+L).
На экране появится окно "Preparing Progress". В какой-то момент оно будет точно таким, как показано на Диа. 5. Красной линией обведены цифры радиусов камней R = 54,55 и т.д. Для нормального распознавания ( по времени и качеству) этот радиус должен быть от 52 примерно до 62. Эта величина устанавливается выбором правильного разрешения при сканировании.
Через некоторое время распознавание закончится и вместо окна Диа. 5. появится окно с доской и позицией на 120-м ходу. Этот ход не распознался, потому что его просто нет на доске. Зато сбоку диаграммы написано, что ход 120 сделан в 67, 137 в 129, 138 в 124, 214 в 208.
Самый простой способ поставить 120-й ход - набрать цифры 6 и 7, т.е. номер хода на место которого ставится 120-й ход. Так и сделаем. Ход 120 превратился из пустого в ход в пункт 67.
Теперь нажмем Ctrl+M. Это значит - перейти к следующему пустому ходу. Это ход 137. Повторим процедуру. Нажмем 1, 2 и 9 - номер хода в который делается данный ход. Черные сбивают два камня.
И т. д.
После того как таким образом будут введены все ходы, появится окно с сообщением "The game is over", а когда вы закроете его, то автоматически появится окно с информацией о партии. Введите информацию и запишите партию. Теперь вы можете просматривать ее, а какже отправить нам, чтобы получить в ответ SGF файл с этой партией.

10. А если при распознавании встретились ошибки. Что делать?

Диа. 6

Это окно появилось после распознавания партии, показанной на Диа. 2. Программа посчитала форовый пункт ходом №4, 4-й ход тоже определила как 4-й и у нее получился двойной ход: два хода с одним номером. Разрешается эта проблема довольно просто. В момент показанный на Диа. 6 кликните мышкой на правильном пункте. Туда будет поставлен камень, а по поводу второго, вам будет задан вопрос:

В данном случае в пункте 4-4 хода вообще нет, поэтому нужно ответить "No move", а если бы программа неправильно распознала какой-то ход, что тоже бывает, вы должны были ввести номер этого хода в левом поле ввода или выбрать из выпадающего списка (правое поле ввода).
Перейти к следующему двойному ходу в партии можно из меню (Game--Go to next double move) или нажав клавиши Ctrl+D.
В диаграмме очень хорошего качества и при не очень большом количестве ходов (до 260) двойных ходов обычно не бывает, а если качество похуже, то обычно встречается 1-2 двойных хода.

11. Как же все-таки получить партии в формате SGF?

А это как раз совсем нетрудно. Главное - это настроить программу на отправку почты. Вы должны открыть Options -- E-mail и ввести следующие параметры:
User e-mail address - ваш адрес на который будут приходить партии в SGF формате.
SMTP server - адрес сервера отправки почтовых сообщений вашего провайдера Интернет
User ID - ваше пользовательское имя для почтового сервера.
Кроме того здесь есть еще одна опция: Maximum Num of BCR files to attaching for 1 mail. Она определяет сколько партий будет отправляться в 1-м сообщении. По умолчанию стоит 10 (т.е. в одно сообщение будет записываться от 1 до 10 партий). Если у вашего провайдера нет специальных требований по количеству присоединенных файлов в сообщении, можете эту опцию не трогать.

Партии которые вы распознаете или вводите вручную атоматически накапливаются в списке, который можно увидеть, нажав File -- Send game. Этот список партий вы можете редактировать: добавлять другие партии по вашему выбору или удалять те партии, которые вы не хотите нам отправлять (просто подсветите партию или группу партий в списке и нажмите клавишу Del).

Когда список партий будет сформирован нажмите кнопку Send. В это время вы, естественно, должны быть подключены к Интернету. Будет автоматически сгенерировано одно или несколько почтовых сообщений, которые будут отправлены нам. У нас на компьютере стоит программа автоматической переконвертации файлов из формата BCR в формат SGF. 4-5 раз в день мы соединяемся с Интернетом, получаем ваши партии и отправляем в ответ SGF файлы.


Contact e-mail: bigo@ukr.net, ICQ: 22951904
This website copyright BiGo Software.