python尝试随机生成测试集和训练集--688IT编程网

python尝试随机⽣成测试集和训练集

尝试随机⽣成测试集和训练集

通常在做数据挖掘或者训练模型时，需要随机按⽐例划分数据集和训练集，这⾥我⾃⼰写了⼀段划分的代码还有⼀份是使⽤sklearn中⼀个函数就划分好的（emmmmm，感谢python各种库）

import pandas as pd

import numpy as np

import math

import random

path1=r'data files\ratings.csv'

csvpath1=open(path1)

ratings_df = pd.read_csv(csvpath1)

#ratings_df.tail()

#tail命令⽤于输⼊⽂件中的尾部内容。tail命令默认在屏幕上显⽰指定⽂件的末尾5⾏。

path2=r'data files\movies.csv'

csvpath2=open(path2,encoding='UTF-8')

movies_df = pd.read_csv(csvpath2)

print(ratings_df.iloc[:,0].size)

#line=ratings_df.iloc[:,0].size

#for i in range(int(line*0.2)):

row_list=[]

line=30

for i in range(line):

#su=random.randint(0,line-1)

su=random.randint(0,line-1)

#print(list(ratings_df.iloc[su,:]))

row_list.append(list(ratings_df.iloc[su,:]))

ratings_df.drop([su],axis=0,inplace=True)#训练集删除该⾏

#set_index(drop = True)

ratings_df = pd.DataFrame(ratings_df,columns=['userId','movieId','rating','timestamp'])

print(ratings_df.iloc[:,0].size)

line-=1

df = pd.DataFrame(row_list,columns=['userId','movieId','rating','timestamp'])

ratings_df.head()

df.head()

print(ratings_df.iloc[:,0].size)

df.drop([0, 1],axis=0,inplace=True)

python新手代码useriddf

补充⼀下看到别⼈⽤sklearn 的⼀个函数实现⽅法

from numpy import random

import numpy as np

num = 10

x = np.floor(10*random.rand(num,2))

y = np.floor(10*random.rand(num,1))

from sklearn import cross_validation

X_train, X_test, y_train, y_test = ain_test_split(x, y, test_size=0.4, random_state=0)

发表评论

688IT编程网

python尝试随机生成测试集和训练集

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python尝试随机生成测试集和训练集

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式