Colección de citas famosas - Diccionario de frases chinas - 【Matriz X】1. estructura de datos

【Matriz X】1. estructura de datos

Consulte la documentación oficial de Xarray, Xarray (1): la estructura de datos de Xarray es avanzada en el procesamiento de datos meteorológicos de Python.

En Xarray, los datos constan de estructuras y etiquetas, que se pueden dividir en las siguientes categorías:

1. Matriz de datos:

Con etiquetas o dimensiones con nombre. matriz multidimensional. DataArray agrega metadatos, como nombres de dimensiones, coordenadas y propiedades, a estructuras de datos subyacentes sin etiquetar, como matrices numpy y Dask.

2. Conjunto de datos:

Una colección de objetos DataArray con una estructura similar a un diccionario alineada con dimensiones. Por lo tanto, la mayoría de las operaciones que se pueden realizar en las dimensiones de un único DataArray se pueden realizar en el conjunto de datos.

Un conjunto de datos es una colección de múltiples matrices de datos.

3. Variables:

Similar a las variables NetCDF. Consta de dimensiones, datos y atributos. La principal diferencia funcional entre variables y matrices numpy es que las operaciones numéricas sobre variables se pueden transmitir a través de nombres de dimensiones.

En términos generales, la variable

Xarray implementa el filtrado y procesamiento de datos mediante la operación de dimensiones con nombre, e implementa el etiquetado y la denominación de datos a través de las siguientes definiciones:

* Dimensión: el nombre de la dimensión de cada eje (por ejemplo ('x', 'y', 'z')).

*Coordenadas: coordenadas o escala. De manera similar a una secuencia de diccionario, etiquete cada punto. Por ejemplo, si la dimensión es latitud, las coordenadas correspondientes son coordenadas de latitud (90 N, 89 N, 88 N...89 s, 90 s).

*Índice: Número de índice, que también se puede decir que es una etiqueta de posición. A [0] representa el número de la matriz A y 0 es el índice.

Como puedes ver, el archivo es un conjunto de datos que contiene variables: variables de datos. Las dimensiones del conjunto de datos son longitud, latitud y tiempo, cada una con sus propias coordenadas. De manera similar, los conjuntos de datos también tienen propiedades que indican información del conjunto de datos.

Podemos hacer esto:

Ver las variables, dimensiones y coordenadas contenidas en el conjunto de datos por separado.

Otro ejemplo son los datos de altura potencial de NCEP:

Básicamente lo mismo que el anterior.

Cabe señalar que hay un formato corto en los datos ncl y la función short2flt() debe usarse al leer. Sin embargo, no hay un formato corto en Python y el valor predeterminado es flotante, por lo que. no hay necesidad de considerar esto.

A veces leemos datos relacionados de otras maneras, pero los datos están en formato np.array, necesitamos convertirlos a DataArray, o necesitamos generar un archivo NC y necesitamos convertir el calculado. matriz al formato DataArray, así que use el método de creación.

1. Datos: datos, que pueden estar en numpy ndarray, series, DataFrame, pandas.panel y otros formatos.

2. Coordenadas: lista de coordenadas o diccionario

Si es una lista, debe ser una lista de tuplas. El primer elemento es el nombre de la dimensión y el segundo elemento es el objeto tipo matriz de coordenadas correspondiente.

Lo mejor es utilizar el formato de diccionario.

3.dims: lista de nombres de dimensiones

Si se omite y coords es una lista de tuplas, los nombres de las dimensiones se toman de coords.

4.attrs: Atributos

5. Nombre: Nombre de la variable

A excepción de los datos, ninguno de los anteriores es necesario.

Cree un ejemplo como este:

Como se mencionó anteriormente, todo menos los datos es innecesario.

Si está convirtiendo datos de DataFrame a DataArray (esta operación se usa a menudo en combinación con Pandas y Xarray):

Identifique automáticamente los nombres de filas y columnas y los números de serie.

Hay ejemplos más complejos en la documentación oficial. Si es necesario, vaya al sitio web oficial para verlos.

Después de crear datos, también podemos usar operaciones relacionadas para obtener diversa información de DataArray:

Si desea modificar el valor de DataArray, puede hacerlo de las siguientes dos maneras :

Los dos resultados son equivalentes, pero el funcionario solo da el primer método.

*Cambie el nombre mediante el comando foo.rename('temperatura'). Por ejemplo, si hgt calcula una nueva variable, puede usar esta instrucción si necesita cambiarle el nombre.

Después de obtener un DataArray, cuando se usa para dibujar, por ejemplo, necesitamos obtener su longitud y latitud (aquí, el ejemplo de ahora es tiempo y altitud), y luego podemos pasarlo directamente .

Estos dos métodos extraen información de coordenadas.

Para modificar o eliminar cierta información de coordenadas, el principio es el mismo que para modificar datos:

El sitio web oficial proporciona una estructura de conjunto de datos utilizando datos climáticos como ejemplo:

ltcentergt

lt/centergt;

Un conjunto de datos, que incluye volumen de datos (temperatura, precipitación) y coordenadas dimensionales (latitud, longitud).

Según el ejemplo del sitio web oficial, el conjunto de datos se crea así, que en realidad es similar a DataArray:

De hecho, este ejemplo es muy diferente de la situación que Generalmente entra en contacto con, porque la mayoría de los datos son unidimensionales.

El funcionamiento de Dataset es básicamente el mismo que el de DataArray y no se describirá nuevamente.