Procesamiento de archivos Fastq
El resultado es una lista de todos los archivos, incluido el nombre completo y la extensión del archivo (.txt, .fasta.gz, etc.).
Recorre cada nombre de archivo.
Si los nombres de los archivos tienen el mismo formato, como nombre_muestra.fastq.gz, puede utilizar expresiones regulares para obtener la información requerida.
Si el directorio de destino no es un archivo sino una carpeta, puede retroceder para obtener el contenido de la carpeta deseada.
Luego se puede procesar el archivo Fastq.gz.
f "{ sample }" puede completar una variable, que forma una cadena de formato fijo, igual que "{0}". formato (ejemplo), pero es más conciso.
Por ejemplo, el archivo fastq.gz.
Según la ruta absoluta de fastq.gz obtenida anteriormente, léala en el diccionario.
Puedes obtener la secuencia según la identificación de la clave.
O cree un diccionario para contar el número de secuencias en el archivo fastq.gz.
Si es un documento fastq.gz con múltiples muestras.
Para que se puedan contar varias muestras juntas.
Pero el diccionario construido de esta manera está desordenado, entonces, ¿cómo ordenarlo numéricamente?
Para una sola muestra:
De hecho, se convierte en una lista de tuplas que consta de un par clave-valor.
Puedes ordenar según el segundo dígito de cada tupla, que es el número.
Después de ordenar, sigue siendo una lista.
Puedes generar el primer número que desees.
La situación es similar para múltiples muestras.
Casi un centavo, ¿no?