无法找回的东西

马尔可夫的脸掩藏在兜帽的阴影下，只有嘴角隐约可见。桌子上是一张密密麻麻写满了字的纸。“继续挑出你想要的字，二十个。”

我细细地梳理了一遍，剩下的基本上都是姓氏，以及一些物品。我把熟悉的人的姓挑了几个，又划去几个，然后填写在一张有二十个方格的纸上。

马尔可夫粗鲁地在方格中央划了一道横线。“选择，上边十个字，或者下边十个字。”

我犹豫了半晌，挪动手指，选了上半区。

马尔可夫又划了一道竖线，那条线笔直而又粗旷，边缘的墨迹慢慢渗开在纸面上。“前五个字，或者后五个字。”

“这种排除法有意义吗？”我恼怒地瞪了一眼马尔可夫。

“有。”他毫不迟疑。

我又慢慢低下头，想了想，“后五个。”

“从里边选一个字出来。立刻。”

“你……”我无奈地低下头，用笔，在第二个字上重重地划了一个圈。

“呵呵。”马尔可夫一把摘下头上的兜帽，笑着靠倒在柔软的沙发里。“这就是信息熵。我们从一万两千个汉字里寻找你的答案，只考虑每个汉字的独立的概率而不计算它们之间的联系的话，每个汉字的信息熵大约是8到9个比特。如果我们再考虑上下文相关性，每个汉字的信息熵只有5比特左右。也就是说，你想找回的东西，就在这50万比特之间。”

“唔……可是，我和这个字之间的故事，你还能找回来吗？”我有些迟疑地说。

马尔可夫指了指我的头，“都在那里边了，但也许，我们永远都无法找回。”

我又低下头，盯着那个划了圈的字。“马尔可夫，重新启动一下你的系统。让我们开始吧，即便是陷入冗余，即便永远也无法找回那东西。”

“好的。”马尔可夫嘴角滑过一丝笑意，左手掠起兜帽，双眼又陷入阴影之中。他从桌子底下拿起一个小本子，“开始了，12914。”

隐含马尔可夫模型：一种数学模型，目前被认为是实现快速精确的语音识别系统的最成功的方法，复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决。

PS：最近太忙了，照顾不到TRIR。这是错误的。我已经请了督察督促我更新博客。