强大的命令行数据分析工具,主要功能是对数字、文本进行统计运算。

支持数字的最大值,最小值,平均值和中值等计算逻辑。

  • 获取一列数字的最大值,最小值,平均值和中值:
seq 3 | datamash max 1 min 1 mean 1 median 1
  • 获取单列浮点数的平均值(浮点数必须使用","而不是"."):
echo -e '1.0
2.5
3.1
4.3
5.6
5.7' | tr '.' ',' | datamash mean 1
  • 获取具有小数精度的单列数的平均值:
echo -e '1
2
3
4
5
5' | datamash -R {{number_of_decimals_wanted}} mean 1
  • 获取单列数字的平均值,忽略'Na'和'NaN'字符串:
echo -e '1
2
Na
3
NaN' | datamash --narm mean 1