基于层级复用模式的语言复杂度度量新指标
原标题:Measuring language complexity from hierarchical reuse of recurring patterns
速览
研究提出ladderpath指数,基于算法信息理论,通过计算层级复用重复子结构的最小步骤来度量语言复杂度。该指标在21种语言语料库中表现出近似不变性,为语言等复杂度假说提供了独立于表示形式的证据。同时,研究揭示了字符集大小与语料长度、词汇级与语料级复杂度之间的权衡关系,支持总复杂度守恒的假设。这一发现与认知科学中的组块机制相呼应,为语言处理提供了新的认知架构解释。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
