python特征生成中字符类型有哪些?

2025-12-01 0 98,522

python特征生成中字符类型有截取、字符长度和频次。

一、python特征生成中字符类型

1、截取

当字符类型的值过多,通常可对字符类型变量做截取,以减少模型过拟合。如具体的家庭住址,可以截取字符串到城市级的粒度。

2、字符长度

统计字符串长度。如转账场景中,转账留言的字数某些程度可以刻画这笔转账的类型。

3、频次

二、python特征类型中字符使用

1、截取第一位字符串

df['I1_0'] = df['I1'].map(lambda x:str(x)[:1])

2、字符长度

df['I1_len'] = df['I1'].apply(lambda x:len(str(x)))

display(df.head())

3、字符串频次

df['I1'].value_counts()

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

声明:以上部本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。投诉邮箱:3758217903@qq.com

ZhiUp资源网 python基础 python特征生成中字符类型有哪些? https://www.zhiup.top/2327.html

相关