参考链接1,参考链接2
将顺序输入的句子输出成树形符合句子结构的非线性数据结构。
现在一般都是用seq2seq模型来做的。
使用PCFG计算每棵树的score,用来选择最好的那棵树。
如果枚举所有的树去找概率,计算量太大,指数级增长。
于是提出CKY算法:大的问题转换成子问题进行两两比较(n vs n转换成 1 vs n-1)
更多见参考链接。