R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客理想。 关于作者: 张丹,分析师/程序员/Quant: R,Java,Nodejs blog: http://blog.fens.me email: bsspirit@gmail.com 转载请注明出处: http://blog.fens.me/r-pinyin/ 前言 在做中文文字处理的时候,我们经常需要把中文转换成拼音,正巧看到R语言中有一个汉字转换成拼音包叫pinyin,试了一下,用起来非常轻巧。 目录 pinyin包介绍 一分钟快速使用 pinyin代码结构 查看汉字与拼音的字典文件 自定义字典文件 1. pinyin包介绍 这个 R 语言包粗暴地用拼音取名为 pinyin,作用是把汉字转换成拼音。从 v1.1.3 开始,增加了将汉字转换成四角号码或五笔字型的功能。从 v1.1.4 开始,用户可以指定自己的字典,随意转换。pinyin项目,核心就是把中文汉字与对应的拼音字典做了映射。 该包的作者为赵鹏博士,环境科学、大气科学专业,西交利物浦大学(苏州)健康与环境科学系助理教授,英国利物浦大学荣誉学术成员,英国高等教育学会会员,博客地址。 本文使用的R的版本为R version 4.2.3,pinyin包的版本1.1.6。 pinyin包,安装过程很简单。 # 安装 > install.packages("pinyin") # 加载 > library(pinyin) pinyin包的项目地址:https://github.com/pzhaonet/pinyin 2. 一分钟快速使用 pinyin包使用起来非常简单,一行代码就能完成文字向拼音的转换。py()是该项目的主函数。 通过一行代码,一个函数就能使用中文汉字转拼音,默认参数的拼音带声调,默认字典为pinyin。 > py("中文") 中文 "zhōnɡ_wén" 写一个句子,再试试。 > py("现在我们正处于大数据时代") 现在我们正处于大数据时代 …
Read more →