Keita (una biblioteca de aprendizaje automático de código abierto)
1. Instalación de Keita
Keita es una biblioteca de aprendizaje automático basada en Python. Python debe instalarse antes de su uso. El método de instalación de Python está más allá del alcance de este artículo. Los lectores pueden buscar información relevante para aprender.
Instalar Keita es muy sencillo y se puede completar con el comando pip. Ingrese el siguiente comando en la línea de comando para instalar Keita:
```
Pippistler
```
2 , The uso de Keita
Keita proporciona una gran cantidad de algoritmos y herramientas de aprendizaje automático para ayudar a los desarrolladores a desarrollar, entrenar e implementar modelos rápidamente. A continuación, presentaremos cómo utilizar Keita y los pasos de operación.
1. Procesamiento de datos
Antes de desarrollar un modelo de aprendizaje automático, se requiere el procesamiento y la limpieza de datos. Keita proporciona algunas herramientas de procesamiento de datos de uso común, como lectura, limpieza y conversión de datos. A continuación, presentaremos cómo utilizar Keita para el procesamiento de datos.
(1) Lectura de datos
Leer datos con Keita es muy simple, simplemente use la función read_csv en la biblioteca panda. Por ejemplo, tenemos un archivo de datos llamado data.csv, que se puede leer usando el siguiente código:
```
importpandasaspd
data=pd .read_csv('data.csv ')
```
(2) Limpieza de datos
Keita proporciona algunas herramientas de limpieza de datos de uso común, como faltantes Manejo de valores, manejo de valores duplicados, manejo de valores atípicos, etc. A continuación, presentaremos cómo utilizar Keita para la limpieza de datos.
Procesamiento de valores faltantes:
```
importpandasaspd
fromketra preprocessingimportimputer
data=pd. read_csv('data.csv ')
Estimador = estimador(estrategia = 'media')
datos = imputer.fit _ transform(datos)
` ``
Procesamiento de valores duplicados:
```
importpandasaspd
fromketra .preprocessingimportdropduplicates
data=. pd.read_csv('data.csv ')
drop_duplicates=DropDuplicates()
datos = soltar _ duplicados . fit _ transform(datos)
``. `
Procesamiento de valores atípicos:
```
importpandasaspd
fromketra preprocesamientoimportwinsorizer
data =pd. read_csv('data.csv ')
Winsorizer = Winsorizer(corte = 0.1, tail='both ')
datos = winsorizer fit _ transform(datos)
```
2. Ingeniería de características
La ingeniería de características es una parte muy importante del desarrollo del modelo de aprendizaje automático. Puede ayudarnos a extraer características que sean útiles para el modelo. Características previstas. Keita proporciona algunas herramientas de ingeniería de funciones de uso común, como selección de funciones, extracción de funciones y transformación de funciones. A continuación, presentaremos cómo utilizar Keita para la ingeniería de funciones.
(1) Selección de funciones
Usar Keita para la selección de funciones es muy simple, simplemente use la función SelectKBest. Por ejemplo, tenemos un conjunto de datos con 10 características y necesitamos seleccionar las cinco características más importantes. Podemos usar el siguiente código:
```
importpandasaspd
fromketra feature _ SelectionimportSelectKBest
data=pd.read_csv(. 'data.csv ')
Selector=selecciona el mejor (k=5)
data = selector .
(2) Extracción de características
La extracción de características usando Keita también es muy simple, solo use la función PCA. Por ejemplo, tenemos un conjunto de datos con 10 características y necesitamos reducirlo a 3 dimensiones.
Puede utilizar el siguiente código:
```
importpandasaspd
fromketra característica _ extracción importpca
data=pd.read_csv. ( 'data.csv ')
pca=PCA(n_components=3)
data=pca.fit_transform(data)
```
(3) Transformación de características
También es muy sencillo usar Keita para realizar la transformación de características, simplemente use la función de características polinómicas. Por ejemplo, si tenemos un conjunto de datos con dos características y necesitamos convertirlo a características polinómicas cúbicas, podemos usar el siguiente código:
```
importpandasaspd
p>deketra.Preprocesamiento para importar entidades poligonales
data=pd.read_csv('data.csv ')
poly =elemento polinómico (grado=3)
data=poly.fit_transform(data)
```
3. Entrenamiento y evaluación del modelo
Antes de desarrollar un modelo de aprendizaje automático, usted necesidad Determinar el tipo de modelo y los parámetros. Keita proporciona algunos algoritmos y herramientas de aprendizaje automático de uso común, como regresión lineal, regresión logística, árbol de decisión, bosque aleatorio, etc. A continuación, presentaremos cómo utilizar Keita para el entrenamiento y evaluación de modelos.
(1) Regresión lineal
Usar la Regresión Lineal de Keita es muy simple, simplemente use la función de regresión lineal. Por ejemplo, si tenemos un conjunto de datos con dos características y necesitamos hacer predicciones de regresión lineal, podemos usar el siguiente código:
```
importpandasaspd
fromketra lineal _ modelimportLinearRegression
data=pd.read_csv('data.csv ')
X=data.drop(['target'], axis=1) p>
y = datos['objetivo']
Modelo = Regresión lineal()
model.fit(X, y)
` ` `
(2) Regresión logística
Usar Keita para realizar LogisticRegression es muy simple, solo use la función de regresión logística. Por ejemplo, si tenemos un conjunto de datos con dos características y necesitamos hacer predicciones de regresión logística, podemos usar el siguiente código:
```
importpandasaspd
fromketra lineal _ modelimportLogisticRegression
data=pd.read_csv('data.csv ')
X=data.drop(['target'], axis=1)< / p>
y =datos['objetivo']
model=Regresión Logística()
model.fit(X, y)
`` `
(3) Árbol de decisión
Es muy sencillo hacer un árbol de decisión con Keita, basta con utilizar la función DecisionTreeClassifier.
Por ejemplo, si tenemos un conjunto de datos con dos características y necesitamos hacer una predicción de árbol de decisión, podemos usar el siguiente código:
```
importpandasaspd
fromketra .treeimportdecisiontreeclassifier
data=pd.read_csv('data.csv ')
X=data.drop(['target'], axis=1)
p>y =datos['objetivo']
model=DecisionTreeClassifier()
model.fit(X, y)
`` `
(4) Bosque aleatorio
Usar Keita para un bosque aleatorio es muy simple, simplemente use la función RandomForestClassifier. Por ejemplo, si tenemos un conjunto de datos con dos características y necesitamos hacer una predicción forestal aleatoria, podemos usar el siguiente código:
```
importpandasaspd
fromketra .ensembleimportrandomforestclassifier
data=pd.read_csv('data.csv ')
X=data.drop(['target'], axis=1)
y =datos['objetivo']
model=RandomForestClassifier()
model.fit(X, y)
```< / p>
4. Implementación del modelo
Una vez completada la capacitación y evaluación del modelo, el modelo debe implementarse en aplicaciones reales. Keita proporciona algunas herramientas de implementación de modelos de uso común, como guardar modelos, cargar modelos, predecir modelos, etc. A continuación, presentaremos cómo utilizar Keita para la implementación del modelo.
(1) Guardar modelo
Es muy sencillo guardar el modelo usando Keita, simplemente use la función de volcado en la biblioteca pickle. Por ejemplo, entrenamos un modelo de regresión lineal y necesitamos guardarlo en un archivo. Puedes usar el siguiente código:
```
import pickle
fromketra .linear_modelimportLinearRegression
model = linear regression()
model.fit(X, y)
withopen('model.pkl', 'wb') asf:
pickle.dump(modelo, f )
```
(2)