如图:中英文文本
▲图1,中英文混合文本
使用Excel函数,把图1的中英文混合文本,进行自动中英文文本识别,并自动分列成独立的英文和中文文本列,最终效果如下图2:
▲图1,中英文自动识别分列成独立列的文本
这里简化过程,直接上图,见下图3:
▲图3,中英文自动识别分列成独立列的文本的全过程
完成整个过程需要注意的是,如果英文文本中含有中文字符或者其它一切的符号,要先转化成相同的字符,如英文字符和标点符号占位是1个字符,中文字符和标点符号占位是两个字符,必须要先替代成英文一致,中文也一致,至少要做到前段或者后段完全一致。
如上图3,就先替换了一些不一致的“,”号。
整个过程只有两种情况,就是要么英文在前端,或者英文在后段;要么中文在前段,中文在后段。
还需要特别注意的是中文字符是英文字符的2倍,有些规律会因为汉字太多,英文太少而无法完成规律过程,因为识别过程中因为英文太少而使得X<>2Y,这时候还可以选择使用第二种规律。
下面是上图3的整个自动识别过程中所使用的所有函数公式,其中有辅助数据,有增加内容“-”“”,有删除内容“空格”,这一切都是为自动识别做配合和扫除阻碍做工作,所有函数公式见下图4:
▲完成图3整过过程使用的全部函数
上面的自动识别过程有点复杂,也许不是最完美的,但整个自动识别分列过程,足足花了我一天时间,好在最后是成功的,而且结果是完美无瑕的。
有些函数公式太长,我把它分成了3个公式段,目的就是担心输错,因为输入多一个“()”,都可能会失败,而且因为太多太长,检查错误始终不容易,而且费劲,虽说可以复制,而一旦复制多了一个空白的空格,也着实够烦人的。
Excel函数的自动化功能,对实际工作来说,在提高工作效率和减少错误方面,是非常有帮助的,唯一的遗憾是,函数设计不那么容易,而且很容易忘记,很多时候,就算是自己设计的函数,时间一长,可能就忘得一干二净。