В этом браузере сайт может отображаться некорректно. Рекомендуем Вам установить более современный браузер.

Chrome Safari Firefox Opera IE  
Меню
x
 
 
Версия для печати

Патентный поиск в зарубежных базах данных

10 января 2019

В эпоху инноваций все более важную роль в экономической жизни общества играет интеллектуальная собственность. Миллионы патентных документов, ежегодно публикуемых в мире, открывают доступ к техническим решениям, чья сущность передается в патентной литературе в таких подробностях, которые сложно найти в отдельно взятых документах иного назначения. Без использования патентной информации невозможны ни анализ рынка высокотехнологичных продуктов, ни «конкурентная разведка» и определение стратегий развития собственного бизнеса, ни проведение НИР и ОКР, направленных на создание новых и совершенствование существующих технологий.

Сегодня объемы патентной информации таковы, что проведение международного патентного поиска технически неосуществимо без электронных баз данных (БД) патентных документов. Стремительный рост их объемов стимулирует непрерывное развитие различных поисковых инструментов. Наряду с электронными БД патентных ведомств и международных организаций по интеллектуальной собственности, предоставляющими пользователям бесплатный доступ к «исходным» данным в виде библиографической информации и текстов патентных документов, появляются сетевые ресурсы и программные продукты на платной основе, которые позволяют работать одновременно с множеством электронных БД, группировать отобранные документы по различным критериям, отслеживать статус существующих или появление новых патентных документов по выбранной тематике, проводить статистический анализ, формировать «патентные ландшафты».

Неотъемлемой частью работы с мировым фондом патентной информации является поиск на основе ключевых слов на различных языках. Значительная доля патентных документов доступна на английском языке. Однако только английского языка недостаточно для полноценного поиска, например, с целью определения мировой новизны рассматриваемого решения. Это связано, в частности, со стремительным ростом количества публикуемых патентных источников на китайском языке. Фонды патентной литературы на японском, немецком, французском также содержат важную и актуальную информацию о передовых технических решениях.

Специалист, не владеющий иностранными языками или освоивший на некотором уровне лишь один иностранный язык (чаше всего английский), может воспользоваться различными инструментами автоматического перевода, доступными в наиболее крупных сетевых базах данных патентной литературы. Так, БД патентных ведомств Японии и Китая позволяют осуществлять автоматический перевод отобранных документов на английский, а ресурс Espacenet — автоматический перевод между множеством различных языков.

Однако задача создания надежного и точного инструмента автоматического перевода пока далека отрешения. Различные технологии машинного перевода зачастую не способны правильно толковать смысловые неоднозначности, скрывающиеся за синтаксической структурой, порядком слов, семантическим разнообразием понятий. Добиться успеха в процессе патентного поиска в США и странах Европы, отбора и анализа патентных документов по-прежнему способен лишь специалист, обладающий знаниями в своей области техники, владеющий терминологическим аппаратом по меньшей мере на одном из иностранных языков и методами подбора ключевых слов, характеризующих рассматриваемое техническое решение.

Основным критерием поиска по электронным БД патентных документов чаще всего выступают ключевое слово, словосочетание или набор ключевых слов либо словосочетаний. От точности их выбора зависят результативность поиска и точность отбора документов для дальнейшего анализа. Ошибка в выборе может привести к снижению эффективности поиска, так как значительное количество отобранных и проанализированных документов окажется нерелевантным по отношению к предмету поиска, а документы с высокой степенью релевантности к предмету поиска будут пропущены.

Отметим основные моменты, которые важно учитывать при проведении поиска.

Работа с патентной информацией на английском языке

Английский язык относится к категории «аналитических» языков, в которых грамматические отношения в предложении передаются главным образом посредством синтаксиса, отдельных служебных слов (предлогов, модальных глаголов и т.п.), фиксированного порядка слов и контекста, а не через словоизменение с помощью зависимых морфем (окончаний, суффиксов, приставок и т.д.), как в русском и многих других европейских языках. Кроме того, английскому языку присуще явление конверсии — превращения одной части речи в другую без признаков внешних изменений. Наиболее убедительный пример — образование глаголов от соответствующих существительных.

Для английского языка характерно также наличие у слов большого количества смысловых значений, идентифицируемых в зависимости от контекста. Многие слова полисемантичны, т.е. передают целый ряд значений, которые могут расходиться подчас довольно широко. Надо иметь в виду, что от терминов, используемых в патентной литературе, требуется однозначность, т.е. наличие только одного раз и навсегда установленного значения, но не все термины в тексте англоязычного патентного документа удовлетворяют этому требованию.

Общеизвестно, что английский глагол to run может обозначать различные действия: «бежать», «запускать» или «исполнять» (компьютерную программу), «содержать» (домашнее хозяйство), «течь» (о реке) и даже «баллотироваться» (в президенты). Слово engine переводится на русский язык как «двигатель», «машина» или «механизм», oil — «масло», «смазочный материал» и «нефть», switch — «выключатель», «переключатель» и «коммутатор». Даже при том, что тексты патентных документов обычно отличаются от общелитературного языка строгостью терминологии и ограниченностью контекста, в них встречаются термины, передающие разные значения в пределах одного текста.

С другой стороны, ряд понятий, часто употребляемых в англоязычных патентных документах, имеет синонимы, которые могут быть использованы как в рамках одного документа, так и в разных источниках — в зависимости от предпочтений автора. В частности, для поиска решений, имеющих отношение к термину «передача данных», придется рассмотреть несколько ключевых слов: to transmit, to send, to communicate.

Чтобы поиск был эффективным и исчерпывающим, следует также учитывать различия в написании одних и тех же слов, а также в словоупотреблении в британском и американском английском: tyre/tire, underground/subway, antennas/antennae и т.п.

Для английского научно-технического стиля характерно использование многочленных атрибутивных словосочетаний, неправильное понимание которых приводит к ошибкам. Обычно для различения однотипных элементов описываемого устройства или системы употребляется порядковое числительное. В этом случае трудности в интерпретации могут вызвать словосочетания вида first data signal transmitter — без понимания контекста трудно определить, идет ли речь о первом передатчике сигнала данных или о передатчике первого сигнала данных.

Построение поисковых запросов

Для эффективного поиска в патентных базах данных на английском языке важен точный подбор ключевых слов, свойственных искомым техническим решениям. Использование в качестве критерия поиска только одного поискового слова, как правило, неэффективно, поскольку в таком случае электронная БД выдаст слишком широкий круг источников. Для максимальной эффективности поиска предпочтительно использовать различные ключевые фразы, наиболее характерные для описания предмета поиска.

Для подбора ключевых слов используются различные приемы. Можно обратиться к электронным словарям, доступным локально или по сети интернет: это могут быть, например, онлайн-словарь «Мультитран» (www.multitran.ru) или устанавливаемые на компьютер электронные словари ABBYY Lingvo. В них словарные статьи отсортированы по тематике, а кроме того, наряду с отдельными словами сюда включены словосочетания, в которых могут использоваться искомые термины. Однако следует учитывать, что в указанных источниках возможны неточности и ошибки в словарных статьях.

В каждой области техники терминология устанавливается различными нормативными документами, в том числе стандартами. В сфере электросвязи/ИКТ международные стандарты принимают такие организации, как Международный союз электросвязи (МСЭ; International Telecommunication Union, ITU), Институт инженеров электротехники и электроники (Institute of Electrical and Electronics Engineers, IEEE), Специальная комиссия интернет-разработок (Internet Engineering Task Force, IETF). В некоторых документах, относящихся к международным стандартам, содержатся двух- или трехъязычные (английский, французский и русский) словари и глоссарии основных терминов, применяемых в области электросвязи. В частности, в Рекомендации MCЭ-RV.573-5 (Словарь по радиосвязи) и Рекомендации МСЭ-R V.662-3 (Термины и определения) есть словарь-глоссарий основных терминов по радиосвязи на русском, английском, французском и испанском языках. Российские организации по стандартизации признают, в частности, ГОСТ 17657-79 «Передача данных. Термины и определения», в котором имеется словарь-глоссарий терминов по тематике передачи данных на русском и английском языках.

Для уточнения ключевых слов при поиске патентных документов в области электросвязи полезны также спецификации стандартов GSM, 3GPP, CDMA и т.п. Так, например, определения основных терминов в области телекоммуникаций, применяемых в стандартах 3GPP, можно найти в Спецификации 3GPP TR 21.905.

Поиск будет более эффективным, если использовать комбинированный запрос, включающий одно ключевое слово или более и одну или более рубрику классификации изобретений. Наиболее известная из таких классификаций — Международная патентная классификация (МПК; International Patent Classification, IPC). Широко используются также Система патентной классификации США (U.S. Patent Classification System, USPC) и Cooperative Classification System (CPC) — совместная разработка Европейского патентного ведомства (ЕРО) и Патентного ведомства США (USPTO).

Сократить время поиска помогают специальные знаки, позволяющие охватить не только конкретную грамматическую форму слова, но и весь набор его возможных форм. В частности, для поиска источников, которые могут содержать различные формы слова rotate (rotating, rotation, rotatable, rotatory), ключевое слово следует ввести следующим образом: rotat*. Ввод ключевого слова в виде rota* выдает такие варианты, как rotary, rotachute и т.п.

Сделать поиск по ключевым словам более продуктивным помогают логические операторы and, or, not, all, any, используемые в сочетании с одним или более ключевым словом. Они обеспечат поиск с условием присутствия в документе каждого слова из вводимого перечня, а также любого слова из вводимого перечня (за исключением одного или более слова из вводимо го перечня) с условием присутствия в документе всех или любых слов из вводимого перечня соответственно. При применении логических операторов сами слова, являющиеся критериями поиска, вводятся в поисковую строку в кавычках.

Машинный перевод при патентном поиске

Интенсивные разработки в области средств машинного перевода патентных документов, потребность в которых все возрастает ввиду ежегодного увеличения объемов патентной литературы и высокой стоимости переводов, дают основания предполагать, что в недалеком будущем инструменты автоматического перевода могут заменить ручной перевод. Действительно, существует широкий спектр технологий автоматического перевода, основанных на грамматических правилах, корпусах текстов, различных статистических моделях, нейронных сетях. В базе данных патентных документов Всемирной организации интеллектуальной собственности (ВОИС: World Intellectual Property Organization, WIPO) обеспечена возможность использования по выбору одной из внешних систем машинного перевода от Google, Microsoft и Baidu, а также собственной системы статистического перевода - WIРО Translate. Электронная БД Espacenet имеет систему автоматических переводов Patent Translate, основанную на разработках Европейского патентного ведомства и Google. Предлагаемые инструменты позволяют осуществлять автоматические переводы отобранных патентных документов, например, с разных языков на английский, и в частности на русский. Базы данных патентных ведомств Японии и Китая также предоставляют доступ к инструментам автоматического перевода патентных документов на английский.

Применительно к поиску патентной информации инструменты автоматического перевода могут быть полезны при решении двух задач: подбора ключевых слов и изучения отобранных документов. Автоматизированный перевод патентных текстов используется в целях зарубежного патентного поиска в мире, в том числе экспертами патентных ведомств. Например, в Федеральном институте промышленной собственности (ФИПС) для экспертизы заявок на патенты РФ использовалась платформа автоматизированного перевода, предоставленная компанией PROMT.

Однако предлагаемые сегодня инструменты автоматического перевода патентных документов далеки от совершенства. Применение машинного перевода в отношении патентной документации осложняется существенным различием лексико-грамматических принципов, используемых в различных видах патентных документов и даже в разных частях одного и того же документа. В качестве примера можно рассмотреть возможные интерпретации англоязычного термина feature в контексте разных частей одного патентного документа. В общем случае он переводится как «признак» (изобретения), однако в характеристике самого изобретения, в частности в формуле изобретения и/или в его подробном описании, может иметь значения «особенность», «компонент», «функция» и т.п. Разрешение подобных семантических неоднозначностей под силу лишь специалисту, компетентному в своей области техники и знакомому со спецификой патентных документов, а не инструменту автоматического перевода.

Опыт изучения различных систем автоматического перевода свидетельствует, что любой прямой машинный перевод патентных документов применим исключительно в ознакомительных целях. Инструменты автоматического перевода не способны решить задачу полноценного перевода патентного документа — они лишь в какой-то степени сокращают нагрузку на переводчика, в особенности при использовании английского языка как промежуточного при переводах на русский язык с других языков.

Однако в случае патентных исследований, которые ограничены извлечением из патентных документов интересующей специалиста информации, средства автоматического перевода могут оказаться весьма полезны. Однако должны соблюдаться следующие условия:

  • изучая документы на японском или китайском языке, надо ориентироваться на их англоязычные аналоги, поскольку прямой автоматический перевод с японского или китайского на русский язык не является достаточно качественным даже для общего ознакомления;
  • для повышения точности анализа документов посредством автоматизированного перевода, например с английского на русский, лучше прибегнуть к сопоставлению не менее двух вариантов автоматического перевода, выдаваемых различными системами;
  • с помощью автоматического перевода можно также формировать запросы из ключевых слов и словосочетаний для поиска, например, в англоязычных базах данных, учитывая при этом рассмотренные выше особенности английского языка, в частности полисемантичность терминов;
  • при определении релевантности отбираемых документов к предмету поиска требуется логический анализ, в частности, тех фрагментов текста, в которых выявлены используемые ключевые слова. Важно иметь в виду не только сам факт присутствия ключевых слов в документе, но и их смысловое содержание в контексте конкретного документа и смысл суждений, в которых фигурируют рассматриваемые ключевые слова.

Данные рекомендации позволят снизить вероятность ошибочной интерпретации анализируемых текстов.

Заключение

Учет при проведении поиска рассмотренных особенностей позволит выявить наиболее релевантные предмету поиска публикации, детальный анализ которых будет способствовать решению задач патентного поиска.


Поделиться:
Вернуться назад