前言与导读

欢迎来到语言结构的实践之旅。无论你来自语言学、计算机还是其他专业,这本手册将帮助你把课堂上的概念变成可以运行的程序、可以观察的结果。在这里,你不只是学习者,更是探索者——用代码去验证语言的规律,用结构化思维与大模型对话,在实践中发现属于你自己的洞见。

一、本手册的定位

本实训手册是《语言结构与计算》课程的配套实践教材,旨在帮助学习者将教材中的理论概念转化为可操作的编程实践和实验技能。

教材以"组合与聚合"为核心线索,系统介绍了语言结构的分析方法和计算表示。本手册围绕这条线索,设计了代码实践(章节同步练习)和综合实验(跨章节项目)两类实训内容,覆盖从基础概念到综合应用的完整学习路径。

二、内容结构

本手册包含以下三个部分:

第一部分:代码实践(与教材各章同步)

graph LR subgraph 基础篇 C1[第一章
组合与聚合] --> C2[第二章
形式·内容·功能] C2 --> C3[第三章
语言的层级结构] C3 --> C4[第四章
语言结构表示] end subgraph 方法篇 C5[第五章
组合结构与语料库] --> C6[第六章
聚合结构与知识库] C6 --> C7[第七章
结构的处理与转换] end subgraph 应用篇 C8[第八章
从符号到向量] --> C9[第九章
结构的运用] C9 --> C10[第十章
理性与经验结构] end

图P-1 代码实践章节结构与学习路径

每章的代码实践包含2-4个可运行的Python程序,其中: - LangSC代码:使用课程配套工具包进行结构分析、语料库检索、网格操作 - 纯Python代码:用标准库实现数据结构、算法和概念模拟,加深对原理的理解

第二部分:综合实验(5个跨章节项目)

表P-1 综合实验概览

实验 主题 核心技能 对应章节
实验一 组合结构的分析与表示 分词、依存分析、JSON结构化 第1、3、4章
实验二 聚合结构的构建与应用 本体设计、知识图谱构建、大模型辅助 第2、6章
实验三 语料库检索与结构发现 BCC检索、模式提取 第5章
实验四 结构化人机协作 显隐互补、提示语设计、智能体三层级结构设计 第8、9、10章
实验五 综合项目 全流程端到端实践 全书

第三部分:附录(参考资料)

三、学习路径建议

flowchart TD START[开始学习] --> READ[阅读教材章节] READ --> CODE[完成对应章节代码实践] CODE --> CHECK{理解是否扎实?} CHECK -->|是| LAB[完成对应实验] CHECK -->|否| REVIEW[复习教材 + 查阅附录A] REVIEW --> CODE LAB --> NEXT{全部章节完成?} NEXT -->|否| READ NEXT -->|是| FINAL[实验五:综合项目] FINAL --> DONE[完成课程实训]

图P-2 推荐学习流程

推荐顺序: 1. 先完成各章代码实践,确保能运行所有示例 2. 按实验一→二→三→四的顺序完成前四个实验 3. 最后挑战实验五(综合项目),将所有技能串联

四、环境配置

4.1 系统要求

表P-2 系统要求

项目 要求
操作系统 Windows 10+、macOS 10.15+、Ubuntu 18.04+
Python 3.8 或更高版本
内存 建议 4GB 以上
编辑器 VS Code(推荐)、PyCharm 或任意Python IDE

4.2 LangSC安装

LangSC是本课程的核心工具包,提供语言结构分析的全部功能。

# 方式一:pip安装(推荐)
pip install LangSC

# 方式二:从本地安装(实验环境)
pip install -e /path/to/LangSC

LangSC依赖本地动态链接库: - Windows:gpflib.dll(安装时自动配置) - Linux:libgpflib.so - macOS:libgpflib.dylib

4.3 验证安装

安装完成后,运行以下代码验证:

import json
from LangSC import GPF

gpf = GPF()

# 测试分词
Ret = gpf.Parse("今天天气真好", Structure="Segment")
words = json.loads(Ret)
print("分词结果:", words)

# 测试词性标注
Ret = gpf.Parse("今天天气真好", Structure="POS")
tags = json.loads(Ret)
print("词性标注:", tags)

如果输出了分词和词性标注结果,说明安装成功。

4.4 补充工具(可选)

部分代码实践使用了以下标准库或第三方库:

表P-3 补充工具库

用途 安装方式
json JSON解析(Python内置) 无需安装
collections 数据统计(Python内置) 无需安装
numpy 向量计算(第八章) pip install numpy
gensim 词向量(第八章,可选) pip install gensim
wordcloud 词云可视化(可选) pip install wordcloud
graphviz 结构图可视化(可选) pip install graphviz

五、代码约定

本手册中的代码遵循以下约定:

  1. LangSC导入:统一使用 from LangSC import GPF
  2. JSON处理:Parse返回JSON字符串,需用 json.loads() 转换
  3. 变量命名:LangSC返回值统一命名为 Ret,与附录A保持一致
  4. 注释说明:关键步骤均附有注释,解释代码逻辑和LangSC用法
  5. 输出示例:重要代码段后附有期望输出格式(以注释形式)

Parse返回格式速查

表P-4 Parse返回格式速查

Structure参数 返回类型 处理方式
"Segment" ["词1", "词2", ...] json.loads(Ret) → 遍历字符串列表
"POS" ["词1/词性1", "词2/词性2", ...] json.loads(Ret)tag.split("/")
"Tree" {"Type":"Tree", "Units":[...], ...} json.loads(Ret) → 访问字典字段
"Dep" Web服务JSON gpf.AddStructure(Ret) → 网格查询

六、获取帮助