Scikit-learn中怎么实现随机搜索

1039
2024/5/18 17:19:58
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在Scikit-learn中,可以使用RandomizedSearchCV来实现随机搜索。RandomizedSearchCV会在指定的参数空间中随机选择一组参数组合,并对这些参数组合进行交叉验证来找到最优的参数设置。

下面是一个简单的示例代码,演示了如何使用RandomizedSearchCV进行随机搜索:

from sklearn.model_selection import RandomizedSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris

# 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 定义参数空间
param_dist = {
    'n_estimators': [10, 50, 100, 200],
    'max_depth': [None, 10, 20, 30, 40, 50],
    'min_samples_split': [2, 5, 10],
    'min_samples_leaf': [1, 2, 4]
}

# 初始化随机搜索
rf = RandomForestClassifier()
random_search = RandomizedSearchCV(rf, param_dist, n_iter=10, cv=5)

# 进行随机搜索
random_search.fit(X, y)

# 输出最优参数设置和交叉验证得分
print("Best parameters found: ", random_search.best_params_)
print("Best cross-validation score: ", random_search.best_score_)

在上面的代码中,我们首先加载了一个伊利斯数据集,然后定义了一个随机森林分类器的参数空间。接下来,我们初始化了一个RandomizedSearchCV对象,指定了要搜索的参数空间、迭代次数和交叉验证的折数。最后,使用fit()方法运行随机搜索,并输出最优的参数设置和交叉验证得分。

通过使用RandomizedSearchCV,我们可以更有效地搜索最优的参数设置,从而提高模型的性能。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: Scikit-learn中怎么实现K均值聚类