谷歌拼音输入法

2007年4月9日 · 阅读需 7 分钟

上星期，隔壁那位 Google 的死忠粉兴冲冲地宣布：“Google 出输入法了！” 我一向对 Google 的产品抱有相当好感，当下便下载了安装包。连续试用了几天之后，我逐渐意识到：这并不只是一个输入法产品的发布，更像是一场“客户端软件网络化”的前奏。

整句拼音输入法的进化史

我是“整句输入”流派的坚定支持者。这些年我前后试用过五六种相关产品，其中较有代表性的包括以下几款：

欧姆龙“拼音王95”：这是我最早长期使用的整句输入法。欧姆龙（Omron）本是以传感器、医疗设备闻名的硬件巨头，涉足中文输入法本就显得相当另类。更难能可贵的是，它是最早尝试“整句输入”这一技术路线的厂商之一。遗憾的是，此后我再未见其推出后续版本。推测欧姆龙最终未能在软件领域找到可持续的盈利模式，从而选择止步。
中文之星“智能狂拼”：随后出现的智能狂拼，在算法和实际体验上都对拼音王形成了明显超越，很快取而代之，成为我的主力输入法。然而最近浏览其开发商中文之星的网站，却发现公司运营状况似乎不甚理想。事实再次证明，在盗版横行的市场环境中，单纯依靠出售输入法授权，很难支撑一家软件公司的长期生存。
微软拼音2003：这是我目前使用频率最高的输入法。依托 Windows 系统的深度集成，它在稳定性、易用性以及系统兼容性方面具有天然优势，其整句输入的准确率在同类产品中也名列前茅。但正因为它是操作系统的附属组件，微软对其投入的资源与关注度始终有限，多年来更新缓慢，词库明显滞后于网络语言的演进。对于早已习惯即时通讯、网络流行语的用户而言，它显得过于“正式”甚至有些陈旧。
搜狗拼音输入法：搜狗推出拼音输入法时，的确让我眼前一亮。他们创造性地将本地词库与搜索引擎中的关键词频率（Query Frequency）相结合，通过互联网数据动态调整词频排序，这在当时无疑是一项令人振奋的创新。可惜的是，在迈出这关键一步之后，搜狗似乎逐渐将重心转向了皮肤（Skins）等 UI 层面的装饰性功能。在我看来，这多少有些本末倒置。其对长句的逻辑建模始终不够理想，严格来说并不能算真正支持整句输入，因此我并未将其作为日常输入法使用。

自 2003 年左右起，整句输入技术事实上进入了一段停滞期。直到现在...

谷歌拼音一经发布，便明确选择了“整句输入 + 网络词库”的技术路线。尽管作为初代产品，它在功能与准确率上尚未形成压倒性优势，但我对 Google 的技术基因仍然充满信心。作为全球最大的搜索引擎公司，Google 聚集了大量顶尖的计算语言学与自然语言处理（NLP）人才，其长期积累远非一般输入法厂商可比。

输入法能赚钱吗？

前两代整句输入法（拼音王、智能狂拼）的结局，几乎宣判了“软件授权收费”模式在这一领域的失败。但谷歌拼音的商业逻辑显然并不在此。

Google 的核心商业模式，始终建立在信息检索与数据分析之上。而输入法，恰恰处在用户产生信息的源头（Source），其战略价值不言而喻。在 Web 2.0 时代，谁掌握了规模化、实时化的数据，谁就掌握了竞争优势。相比于被动地爬取网页内容，输入法能够更早、更直接地捕捉到用户“正在想什么”“准备写什么”，其信号价值远高于事后分析。在完成基础的数据收集之后，对用户输入行为的深度挖掘，将可能催生新的商业模式与增长点。

有意思的是，新一代输入法的主要推动者——搜狗、Google，以及传闻中的百度——几乎清一色都是搜索引擎公司。这并非巧合，而是搜索技术向桌面端自然延伸的结果。

软件服务的网络化

谷歌拼音的出现，清晰地印证了软件产业的一个重要趋势：利用网络资源，实时增强本地软件的能力与体验。

未来的软件不再是封闭的孤岛。具体到输入法领域，通过网络实时获取全网的搜索频率、新词热词，并据此动态调整本地词频排序，将极大提升输入效率与准确率。

推而广之，这种模式完全可以复制到更多领域。例如机器翻译软件，多年来进展缓慢，其核心瓶颈正是语料不足。如果能够充分利用互联网上不断增长的双语对照文本，通过分布式计算寻找最自然的翻译匹配方式，将有望彻底改变翻译软件“生硬直译”的现状。

至于竞争层面，搜狗曾宣称已申请“网络信息与输入法关联”的相关专利。如果这种基础性的“互联网思维”都可以构成专利壁垒，那么未来几乎所有网络工具都将不可避免地陷入专利混战。这更像是一种商业防御策略，而非真正的技术护城河。

云端计算与群体智慧

围绕谷歌拼音及整个输入法行业的未来，我认为至少还有三个方向值得深入探索，它们或许指向输入法的“终极形态”：

从“在线词库”到“在线处理”

目前的输入法即便支持词库同步，其核心计算与存储仍主要受限于本地 PC。本地词库通常只有 MB 级规模，这对于高质量的整句输入而言远远不够。

或许将来可以把处理过程放在服务端。当用户输入时，客户端在后台实时连接服务器端的超大规模句库，在更丰富的上下文中寻找最优匹配。这本质上是利用服务器端的算力与存储优势，弥补本地计算能力的不足，从根本上提升整句输入的准确性。

垂直领域的社会化协作

谷歌拼音目前的用户词库同步体验已经相当不错，但仍有进一步扩展的空间，例如引入“群组词库”：包括公司员工可订阅内部专用词库，包含项目代号、产品名称、人员信息等，还有医疗、IT、法律等专业领域可建立共享的行业词库。

这种基于群体智慧的协作机制，将在特定场景下明显优于单一算法推荐。

语法分析的回归与进化

在试用过程中我发现，谷歌拼音目前几乎未体现出明确的语法分析能力，这使其在复杂句子的处理上尚不能称为完整意义上的“智能整句输入法”，与智能狂拼、微软拼音相比仍有差距。

我期待在 Google 后续版本中，能够看到其深厚的自然语言处理积累真正下沉到前端，补齐这一关键短板。

整句拼音输入法的进化史​

输入法能赚钱吗？​

软件服务的网络化​

云端计算与群体智慧​

从“在线词库”到“在线处理”​

垂直领域的社会化协作​

语法分析的回归与进化​