头图潜台词:至少我们还有一支“国家队”
——出自《喜剧之王》
年,科睿唯安的郭老板坐在我对面;
她问我,中文检索就那么重要么?
我说,是真的很重要...
之前,他们不会有这个疑问;
四年之后,他们买下了incoPat专利数据库。
1.历史的天空
在专利数据信息化的浪潮下,国内专利检索网站/数据库其实十几年前就有了。
有知识产权出版社的CNIPR,信息中心的专利之星,有要做平民专利检索的soopat,以及开始商业化的大为、佰腾等数据库,甚至还有专注医药行业的东方灵盾数据库,一串串熟悉的名字划过十多年前的历史天空...
但是当时在市场上,他们竞争不过以汤森路透数据库(当时叫ThomsonInnovation,TI)为首的国外专利数据。
诸如Orbit、innography、律商联讯的Totalpatent等等国外数据库,在之前的十年的国内市场上,也是颇为活跃。
以汤森的TI为例,数据全,检索运算成熟,数据分析软件(TDA)也较为先进;比如现在你几乎耳熟能详的专利地图、聚类分析等等,其实最早就是他家的功能。
关键后面还有一堆人专门给做专利信息的人工改写,提高检索体验...你说气人不?
专利数据库这个产品,讲究的是数据、技术、金钱,而且还是要不断投入的那种。
数据不全的,离场;
数据更新不快的,离场;
功能不升级的,离场;
检索准确度不能提高的,离场;
总之,谁先不愿意继续砸钱,谁就提前离场。
回头想来,国内专利专利数据库之所以在过去10年时间得到了快速发展,有几个因素不得不提。
其一,中文检索的需求越来越大,毕竟你不能逼着所有人用英文检索,这也是最能体现和国外数据库差异化的地方。
其二,中国专利数据越来越大。无论是欧专局、日本特许厅都承认这个“头疼”的问题,中国的海量专利数据,对他们原有的检索系统造成了巨大挑战。
而把中文专利翻译成外文放进数据库,再用外文检索词检索出来,这样兜一圈子翻译了两次,那准确度自然比不上用中文检索中文专利。
其三,国家当时大力倡导专利分析事业,地方在推动专利导航,专利预警等等各种项目。
于是,国内市场对数据库的需求大了,于是国内专利数据库的提供商也得到了前所未有的发展机会。
.选手
首先,是拥有最新最全国内专利数据的知识产权出版社。
靠着他们之前做官方数据库、CNIPR的经验和技术,做了一套Inspiro数据库出来。
这套Inspiro系统,面世即是“庞然巨物”,涵盖了专利、商标、版权、判例等等,其实是一个巨无霸性的知识产权数据库了。
你叫它专利数据库“国家队”也没有问题,因为知识产权出版社的控股方,其实不是国知局,而是国务院。
在年左右,市场上可以看到合享的incoPat数据库和智慧芽数据库。
incoPat的创始人孙老板,最早是做工程建筑起家,他是几位因“想不开”误入专利行业,不得不辛苦赚钱的老板之一。
智慧芽的两个创始人一个是新加坡人,一个是四川妹子,两人在美国某名校认识,后来回中国创业,于是就有了智慧芽。
到了年下半年,另一种数据库开始冒头。起初都是熟人之间问问,“唉,有个数据库新做出来的,你可以试试”。
这就是Patentics,由美籍华人裘博士开发。据说最初想卖给谷歌,但是谷歌没有要,于是就有了谷歌专利检索。
Patentics的算法是开创性的,当时专利性等等指标都很有意思,尤其是语义检索,对相关性进行排序,后来发现居然很对审查员的胃口。
上述这四家是过去几年能看到的较为知名的数据库了,其它数据库不是没有,是来了又走了。
比如soopat开始卖会员了;大为、佰腾,存在感在消失;SOOIP、润桐等等号称终生免费;还有万象云等等昙花一现,但是始终没有走上中心舞台。
因为啥呢?因为专利数据库需要数据、技术、金钱的持续投入;
而且更离不开的是市场,迎合市场、开拓市场、运营市场。
3.市场
年可能是很有意义的一年。
那一年,知识产权出版社入局,推广专利数据库“国家队”。
那时的Inspiro数据库,检索字段超过个,支持6万条数据下载,而且分析条目无上限!
这样强大功能谁不喜欢?启动会、研讨会热火朝天,收获了不少央企、国企、高校方面的订单。
但是苦于自己的单位性质,并没有办法铺开销售人员,跑遍全国市场,所以你才会觉得它“很低调”。
那一年,国外资本也在风起云涌,居然瞧上了中国知识产权服务市场。
做了几轮市场调研之后,汤森路透把知识产权业务卖了,于是有了现在的科睿唯安,TI数据库也改名DI数据库。
不变的是,他们还是没有做中文检索,于是就有了文章开头的那段对话。
那一年,智慧芽和incoPat的专利分析功能继续升级,先后上线专利地图等功能。
此时,这两家数据库在功能上基本已经成熟,在数据上覆盖的国内数据和主要国家的数据,已经够用;应付诸如专利导航、专利预警之类项目也已经足够了。
可以说,在中国人最为看重的“性价比”指标上,这两家反而又把科睿唯安甩在了身后,市场也就随之打开。
而那时的Pantentics,还在拿专利无效案例的对比文件,讲述着自己语义检索的故事。
他们最终把自己“扎根”在了专利审查员的圈子里了。
年,江苏知识产权中心那边主办了第一届专利检索大赛,那时候赞助的数据库只有两家,合享和智慧芽。
决赛时全国近百位参赛选手齐聚一堂,他们要么是合享的用户,要么是智慧芽的用户,其乐融融。
这是当时国内专利数据库市场的一个缩影。
4.洗牌
科睿唯安独立出来以后,又和知识产权服务商CPA合并,顺带合并了innography数据库。
之所以是合并这个词,是因为双方都自称收购的对方,以至于我只能用合并这个词。
但是谁也没想到,今年incoPat也会被他家突然收购。
原本只是一个买卖,从科睿唯安的角度看,收购是个不错的选择,说好听是补齐中低端市场;说不好听,是为了当年不做中文检索“填坑”。
但是,下一刻同行们就反应过来,难道源自本土技术的民营商业数据库,居然一夜归零?又成了国外数据厂商的天下?
智慧芽的技术有新加坡的血统,Pantentics的创始人是美籍华人,都被认为不算是严格意义上的,本土专利数据库。
不过,大家可能都忽略了“低调”的知识产权出版社的Inspiro数据库,至少我们还有一支国家队。
再后来,问题就发展成对“卡脖子”的担心,对数据安全的担心。
故事是这样讲的,因为检索服务器在国外,当你检索时检索请求会发送到国外的服务器,并留下痕迹。这样一来检索数据就可能被窃取,研发方向就有可能被窃取。
理智的来说,早十几年我们就用webofscience查文献,用DII(DerwentInnovationsIndex)查专利,这俩也是汤森路透的产品,那时候我们就不担心被泄密了?
考虑到公司商誉与市场规则,专利数据库泄密的事还从来没有听说过。
但是卡脖子的事,其实也不得不提,因为有华为被断供的事情。
当我们需要检索专利,开发新技术的时候,人家说我不卖给你数据库了,该怎么办?
这个逻辑更合理一些,也无法反驳,毕竟华为就是例子。
当然,我说的也不算,敏感单位可能真的不允许有一丢丢的泄密机会;而那些上了美国“实体名单”的大学、企业等,也许不得不考虑的这种事情的可能。
目前看,就只有知识产权出版社的“国家队”数据库,不用担心这个问题。
以上就是对国内专利数据库市场过去的八年小结,国内的专利数据库经历了从无到有,再到成熟的过程。
无论是被外资收购的,还是继续辛苦耕耘的,还有高举国家队大旗的,谨祝愿大家越做越好!
我是百科君,一个集才华和知产于一体的,
信息挖掘机!
家专利事务所广泛使用,
好评率99%的IP管理系统,真香!(点击链接查看详情介绍)韩百科君