统计分析

描述性统计与数据预处理

提供全面的数据预处理和描述性统计功能,帮助您高效清洗数据、分析数据特征,为后续深入分析奠定基础。

数据预处理

缺失值处理

检测并处理数据中的缺失值,支持多种填充策略和缺失模式分析。

均值填充 中位数填充 多重插补
使用工具

数据标准化

对数据进行标准化和归一化处理,消除量纲影响,便于比较分析。

Z-score标准化 Min-Max归一化 Robust缩放
使用工具

数据筛选

根据条件筛选数据,支持多条件组合查询和复杂逻辑表达式。

条件筛选 范围筛选 正则表达式
使用工具

独热编码

将分类变量转换为数值型变量,支持有序和无序分类变量的编码处理。

One-Hot编码 标签编码 特征哈希
使用工具

样本均衡

处理不平衡数据集,支持过采样、欠采样和合成采样等多种策略。

SMOTE 随机过采样 随机欠采样
使用工具

异常值检测

识别数据中的离群值和异常点,提供多种异常检测算法和处理建议。

IQR方法 Z-score Isolation Forest
使用工具

传统方法基线配准

采用经典统计学方法进行基线数据校准,确保不同批次或来源数据的可比性。

均值校正 标准化缩放 回归校正
使用工具

倾斜匹配

处理数据分布倾斜问题,通过倾向性评分匹配等方法改善数据平衡性。

PSM匹配 熵平衡 遗传匹配
使用工具

文件及文件夹重命名

批量重命名文件和文件夹,支持多种命名规则和批量操作,提高数据管理效率。

批量重命名 命名规则 数据管理
使用工具

数据比对合并工具

数据合并

合并多个数据集,支持行合并和列合并,提供多种合并方式和键值匹配。

内连接 左连接 外连接
使用工具

数据比对合并

比较两个数据集的差异,自动识别相同和不同的记录,生成差异报告。

记录比对 字段比对 差异高亮
使用工具

重复数据处理

检测并处理数据中的重复记录,支持基于关键字段的重复识别和自动去重。

重复检测 智能去重 保留最新
使用工具

数据拼接

按行或按列拼接多个数据集,支持相同结构或不同结构的数据组合。

垂直拼接 水平拼接 结构对齐
使用工具

基础统计量计算

集中趋势指标

计算数据的均值、中位数、众数等反映数据中心位置的统计量。

均值 中位数 众数
使用工具

离散程度指标

计算数据的方差、标准差、极差等反映数据分散程度的统计量。

方差 标准差 四分位数
使用工具

统计摘要表

生成完整的数据统计摘要表,包含所有重要统计指标和分位数信息。

批量计算 导出报表 分组统计
使用工具

分布分析

频数分布分析

生成变量的频数分布表和直方图,分析数据的分布特征。

连续变量分组 分类变量统计 累积频数
使用工具

正态性检验

检验数据是否服从正态分布,提供多种统计检验方法和可视化结果。

Shapiro-Wilk Kolmogorov-Smirnov Q-Q图
使用工具

交叉表分析

生成两个或多个分类变量的交叉表,分析变量间的关联性。

列联表 百分比分布 关联分析
使用工具

相关性分析

Pearson相关分析

计算连续变量间的线性相关系数,分析变量间的线性关系强度。

相关系数矩阵 显著性检验 热力图
使用工具

Spearman相关分析

计算变量间的秩相关系数,适用于非线性关系和有序分类变量。

秩相关 非参数检验 等级数据
使用工具

相关性可视化

生成相关性热力图、散点图矩阵等可视化图表,直观展示变量间关系。

热力图 散点图矩阵 相关性网络
使用工具

数据可视化

基础统计图表

生成直方图、箱线图、饼图等基础统计图表,直观展示数据特征。

直方图 箱线图 饼图
使用工具

高级数据可视化

生成散点图、线图、条形图等高级统计图表,深入分析数据关系。

散点图 线图 条形图
使用工具

图表定制与导出

自定义图表样式和参数,支持多种格式导出高质量图表用于论文发表。

SVG导出 PNG导出 PDF导出
使用工具

描述性统计使用指南

快速掌握描述性统计分析工具的使用方法,高效完成数据分析任务

1. 数据准备

上传数据文件或粘贴数据,进行数据格式检查和基本预处理,确保数据质量。

2. 分析设置

选择需要分析的变量和分析方法,设置相关参数,系统提供智能默认值和参数说明。

3. 结果解读

查看生成的统计结果和图表,系统提供结果解释和专业建议,支持结果导出和分享。