Fork me on GitHub

Python与R中Data.Frame的对应函数表

无论是Python还是R,在数据处理方面都有非常强大的功能。作者是一个对R函数非常熟悉但对Python中数据处理方法不怎么了解的人。最主要还是体现在一些函数上。我在R中最常用的数据容器有data.frame, list和array。对应到Python的pandas package为pd.DataFrame, list和pd.Series.下面就来说说对应的函数。

在此之前,我们要知道R是函数式语言,而Python是面向对象语言。所以在R中操作的形式是foo(data,…),而在Python中操作的形式为data.foo(…).另外一点是,在R中数组索引从1开始,而python中数组索引从0开始。在对数据操作的转换比较熟悉了之后,我们可以具备在两种语言中进行数据操作的能力。

R Python Explanation
Summary() data.describe() ——————–
max() data.max() ——————–
min() data.min() ——————–
class() data.dtypes ——————–
head() data.head() ——————–
tail() data.tail() ——————–
t() data.T ——————–
df[sort(df$index),] data.sort_index() /data.sort_values(by=’colname’) ——————–
df[‘A’]/df$A df[‘A’] ——————–
df[1:3,c(‘col1’,’col2’)] df.loc[0:2,[‘col1’,’col2’]] ——————–
\ df[‘index1’:’index2’] ——————–
class() data.dtypes ——————–
class() data.dtypes ——————–
class() data.dtypes ——————–
class() data.dtypes ——————–
class() data.dtypes ——————–
No pain, No gain