可以将一个文本文件的内容拆分为多个文章,甚至形成树状结构,都是支持的,下面来举例说明。
在编辑界面顶部工具栏从右端数第5个为“导入导出文本”,点击弹出对话框,点击“打开txt文件”,再点击“智能拆分章节”,即可看到拆分好的章节,继续点“导入拆分章节”,导入完成,刷新网页即可看到,再点存盘按钮右侧的发布按钮,发布完成,再点右上角“阅读界面”,即可听读制作好的内容。
点击“智能拆分章节”时,在第2个输入框会给出当前标题的正则表达式,例如:(\n|^) * *.{1,26} * *\n
下面进行解释(你也可以让AI解释正则表达式):“(\n|^)”
这部分里\n表示换行符,|表示或者,它需要括起来,^表示文件开头,整体含义就是标题的最前面是换行符或者文件开头;“ * *”
这部分星号表示0到多个,两个星号前面的是英文和中文空格,意思是说标题以换行或文件头位置开始,接下来可以有0到多个中英文空格;“.{1,26}”
这部分里句点表示除了换行符号以外的其它任意字符,{1,26}表示最少1个最多26个,意思是标题最少1个字,最多26字;“ * *\”
表示标题的后面也有0到多个中英文空格;
\n 标题最后以换行符结尾。
你需要检查拆分好的章节里面有无错误,如有错,可调整上面的正则表达式,然后点“用标题关键词拆分章节”,当然如果原始文本不符合规律你需要改原始文本。
如想了解如何拆分标题,可看下面例子:
最上面的内容包含两篇文章:
文章1:标题1(内容: aaa bbb ccc )
文章1:标题2(内容: aaa bbb ccc )
如何将这两篇文章拆分呢?
关键词是标题2字,输入标题,点击“预览拆分文本”,即可看到拆分结果:
1, 标题:标题1, 长度:11字符
2, 标题:标题2, 长度:15字符
如何形成树状目录结构呢?如下图所示:
不同层级的标题用 ‘|’ 连接,拆分关键词输入“节”(注意这要求文章内容不包含这个字,如果包含,拆分关键词可输入 “第\d+节”,这是正则表达式,\d+表示1到多个数字)
这样导入后就能形成树状目录结构,例如像《资治通鉴》就是双层目录,300多万文字,也都是一键导入的。
唐库导出的文本是可以原样导入的,参考一下导出的文本,你就知道如何导入目录了。
唐库目前可以导入txt, pdf, docx, epub 四种文件,可以导入txt(通过标题拆分), epub中的目录;pdf, docx暂不支持,可以通过LibreOffice(免费软件)先转为epub再导入。
还可以导入目录下的所有txt, docx文件,磁盘目录结构可转变成文章的目录结构。