Чтобы быть в курсе международных событий, достаточно каждый день читать одну и ту же газету.
А вот химику, чтобы быть в курсе всех «химических событий», надо ежемесячно прочитывать более… 7000 различных журналов, издающихся на десятках различных языков мира. Естественно, что нм одному человеку это не по плечу.
Но ведь надо же как-то узнавать, чем занимаются твои коллеги. Иначе может оказаться, что твоя работа или делается, или уже кем-то сделана.
Газеты из точно такого же положения выходят очень просто: они преподносят своим читателям вместо подробного описания событий краткие сообщения. Значит для химиков должны выпускаться журналы, печатающие
«Сливки» химической информации!
Химики уже давно издают так называемые реферативные журналы. В редакциях этих журналов специальный штат сотрудников (иногда более тысячи человек) прочитывает «от корки до корки» все химические журналы мира и по каждой помещенной в них статье пишет краткую информацию — реферат.
Самый старый химический реферативный журнал — немецкий журнал «Chemisches Zentralblatt», которому в нынешнем году исполняется 185 лет. Гораздо моложе американский реферативный журнал «Chemical Abstracts» — ему через два года исполнится 110 лет. И, наконец, в 1953 году был создан советский «Реферативный журнал Химия».
Реферативный журнал — неоценимый помощник химика. Опытным ученым он нужен для того, чтобы постоянно быть в курсе каждодневных событий химической жизни, а начинающим химикам — для того, чтобы познакомиться с новой областью.
Но пользоваться реферативным журналом можно по-разному. Можно просто читать его, как любой другой журнал — от начала и до конца. Но беда в том, что объем реферативных журналов фантастически быстро растет. Еще в первые годы после второй мировой войны химик мог просматривать весь реферативный журнал. Нынче же число рефератов в годовом комплекте журнала приближается к полутораста тысячам!
Поэтому сейчас химик, прежде чем заглянуть в реферативный журнал, ищет номера нужных ему рефератов в специальном указателе.
К каждому тому реферативного журнала прилагается несколько указателей. Перечислим их по порядку.
— Формульный указатель — список формул всех встречающихся в данном томе веществ.
— Авторский указатель — алфавитный список фамилий авторов, чьи статьи прореферированы в журнале.
— Патентный указатель — перечень патентов, рефераты которых помещены в журнале за год.
— Предметный указатель — в нем приведены названия всех химических соединений, встречающихся в данном томе, основные химические понятия, классы веществ, области их применения и еще многое другое.
Предметный указатель и есть, пожалуй, самая важная часть реферативного журнала. Обычно химик просматривает предметный указатель, находит там нужные ссылки и по ним ищет интересующие его рефераты. И потом уже, прочитав реферат, решает, нужно ли ему смотреть оригинальную статью, чтобы узнать все подробности.
Не правда ли, просто, удобно и хорошо? Но, как говорится,
хорошо, да не слишком…
Дело в том, что растет не только объем реферативного журнала. Растет и объем указателя. Если сводный предметный указатель «Chemical Abstracts» за десять лет (1936—1945 годы) состоял из пяти больших томов, то такой же указатель за 1946—1955 годы — из 19 томов. Можно себе представить, что будет через 20 или 30 лет? Читать тогда указатель будет не легче (а может быть, и труднее), чем сам реферативный журнал. Или же придется делать «указатель к указателю»…
Где же выход? И вообще, существует ли он?
Да, существует. Представим себе электронно-вычислительную машину, в памяти которой хранится информация, содержащаяся во всех томах реферативного журнала, изданных за все годы его существования. Такая машина могла бы по нашему заказу подбирать, а может быть, и печатать на карточках рефераты по интересующей нас теме.
Сегодня во многих книгах и статьях мы можем прочитать о проектах такой машины. Но каким образом можно «загрузить» в память машины химическую информацию? Ведь электронная машина оперирует не словами, а числами. Значит, каждое слово надо сначала перевести с человеческого языка на «язык» машины.
Для обычных слов эта проблема уже давно решена. Но вот как быть с химическими формулами и названиями веществ, с помощью которых эти формулы описываются?
Для того чтобы перевести обычное слово на «язык» машины, надо составить алгоритм — правило, по которому делается перевод.
Но вот несколько лет тому назад американские ученые проделали такой эксперимент. Группу студентов научили правилам записи химических формул в строчку, в виде набора символов и чисел, и дали им задание перевести формулы в такую линейную запись, а затем запись — обратно в формулы.
И оказалось, что испытуемые при этом совершила от 20 до 80 процентов ошибок! Иначе говоря, заполнять память машины «вручную» не следует, надо «научить» машину саму читать и переводить прочитанное на свой, «машинный» язык.
Современного читателя этим не удивишь. Все знают, что машины уже пробовали переводить научные тексты с языка на язык, правда, небольшими отрывками. И ничего, получалось…
Но в данном случае возникло неожиданное затруднение. Дело в том, что так называемое структурное название химического соединения — это в сущности условное описание его структурной формулы, или даже пространственной модели. Химики и математики совместно решили, что для «удобства» машины структурные названия веществ надо переводить в структурные формулы. Для этого тоже нужно составить правило перевода — алгоритм.
Но хотелось бы знать,
возможно ли это?
Мы уже говорили, что структурное название описывает формулу. Не значит ли это, что его перевод можно сделать очень просто?
Да, это было бы просто, если бы названия химических соединений были построены по единой, логичной системе. Но, к сожалению, в химической номенклатуре мы сталкиваемся с причудливым нагромождением названий и правил, доставшихся нам в наследство от разных химических теорий.
Кроме того, химическая номенклатура имеет в каждой стране свои национальные особенности. А при общении химиков разных стран и переводе химической литературы эти особенности зачастую просто заимствуются, в результате чего возникает еще большая «номенклатурная неразбериха».
Например, в немецких журналах цифры, обозначающие положение заместителей, помещаются в слове-названии перед префиксами и после суффиксов. Во французских журналах — наоборот, после префиксов и перед суффиксами, а в журналах, выходящих в США, цифры принято помещать и перед префиксами, и перед суффиксами. И вот, одно и то же вещество называется:
во Франции: метил-Лбут-2-ен-1-ол
в ГДР и ФРГ: 2-,метил6утен-2-ол-1
Если же приходится сталкиваться с названиями сложных веществ, то трудно бывает разобраться, с каким типом номенклатуры мы имеем дело и какая цифра к чему относится — то ли к одному слогу названия, то ли к другому. Такое название приходится порой «распутывать», как кроссворд.
Еще сложнее задача машинного перевода становится тогда, когда структурная формула представляет собой сложное сочленение колец. В этом случае для того, чтобы получить однозначное название, требуется совершенно определенным образом ориентировать всю систему и перенумеровать все углеродные атомы в строго определенном порядке:
Но ведь машина не знает, где «верх», а где «низ», где «право», а где «лево». Она расставит цифры как попало и в результате получится химическая абракадабра…
Следовательно, при составлении алгоритма для машинного перевода, мы должны учитывать все возможные причуды номенклатуры.
Из всего этого становится ясно, как сложно научить машину «читать» химические тексты. Однако задача хотя и сложна, но принципиально разрешима — ведь могут же сами люди как-то разбираться во всей этой премудрости!
Но об этом — особый разговор. Скажем только, что не за горами тот день, когда химики не будут больше тратить свое драгоценное время на утомительное и однообразное перелистывание страниц указателей и реферативных журналов.
А. М. Цукерман, ученый секретарь комиссии по номенклатуре АН СССР