马尔可夫的脸掩藏在兜帽的阴影下,只有嘴角隐约可见。桌子上是一张密密麻麻写满了字的纸。“继续挑出你想要的字,二十个。”

我细细地梳理了一遍,剩下的基本上都是姓氏,以及一些物品。我把熟悉的人的姓挑了几个,又划去几个,然后填写在一张有二十个方格的纸上。

马尔可夫粗鲁地在方格中央划了一道横线。“选择,上边十个字,或者下边十个字。”

我犹豫了半晌,挪动手指,选了上半区。

马尔可夫又划了一道竖线,那条线笔直而又粗旷,边缘的墨迹慢慢渗开在纸面上。“前五个字,或者后五个字。”

“这种排除法有意义吗?”我恼怒地瞪了一眼马尔可夫。

“有。”他毫不迟疑。

我又慢慢低下头,想了想,“后五个。”

“从里边选一个字出来。立刻。”

“你……”我无奈地低下头,用笔,在第二个字上重重地划了一个圈。

“呵呵。”马尔可夫一把摘下头上的兜帽,笑着靠倒在柔软的沙发里。“这就是信息熵。我们从一万两千个汉字里寻找你的答案,只考虑每个汉字的独立的概率而不计算它们之间的联系的话,每个汉字的信息熵大约是8到9个比特。如果我们再考虑上下文相关性,每个汉字的信息熵只有5比特左右。也就是说,你想找回的东西,就在这50万比特之间。”

“唔……可是,我和这个字之间的故事,你还能找回来吗?”我有些迟疑地说。

马尔可夫指了指我的头,“都在那里边了,但也许,我们永远都无法找回。”

我又低下头,盯着那个划了圈的字。“马尔可夫,重新启动一下你的系统。让我们开始吧,即便是陷入冗余,即便永远也无法找回那东西。”

“好的。”马尔可夫嘴角滑过一丝笑意,左手掠起兜帽,双眼又陷入阴影之中。他从桌子底下拿起一个小本子,“开始了,12914。”

隐含马尔可夫模型:一种数学模型,目前被认为是实现快速精确的语音识别系统的最成功的方法,复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决。

PS:最近太忙了,照顾不到TRIR。这是错误的。我已经请了督察督促我更新博客。