domingo, 9 de diciembre de 2012

TIPOS DE FORMATOS DE ARCHIVOS

En computación existen  básicamente dos tipos de  archivos, los archivos ascii y  los archivos binarios. El  vocablo  ascii es un acrónimo  para American Standard Code for Information Interchange. Es un estándar que asigna un valor numérico a cada carácter, con lo que se pueden representar los documentos llamados de Texto Plano, es decir, los que son legibles por seres humanos. Los archivos binarios son todos los demás. Como ejemplos tenemos:


·  Archivos binarios:
 Son aquellos que necesitan de progamas especificos o diferentes formatos asi .jpg, .mp3, .avi entre otros.

  • De imagen: .jpg, .gif, .tiff, .bmp (Portable bitmap), .wmf (Windows Meta File), .png (Portable Network Graphics), .pcx (Paintbrush); entre muchos otros
  • De video: .mpg, .mov, .avi, .gif
  • Comprimidos o empaquetados: .zip, .Z, .gz, .tar, .lhz
  • Ejecutables o compilados: .exe, .com, .cgi, .o, .a
  • Procesadores de palabras: .doc

Archivos ascii:
Fueron creados originalmente para poder ser abiertos a cualquier computadora ya sea diferente sistema operativo teniendo en si una gran característica los códigos html que fueran leídos sin tener problemas de compatibilidad.

  • Archivos fuente: .f, .c, .p
  • Formatos de texto: .tex, .txt, .html
  • Formatos de intercambio: .rtf, .ps, .uu
Dentro de los archivos ASCII de uso común por los programas de bioinformática están los siguientes:
  • De secuencias: .seq
  • De secuencias múltiples: .aln, .msf (Multiple Sequence Format, secuencias alineadas), .rsf (Rich Sequence Format, estos archivos pueden incluir una o más secuencias relacionadas o no).

Todos estos archivos se caracterizan por tener ciertos formatos distintivos, que hacen posible su reconocimiento por parte de los programas de manipulación y análisis de secuencias como el PHYLIP, el GCG; entre muchos otros. A continuación se muestran algunos de los formatos mencionados señalando cada una de sus características distintivas:
  • Formato PHYLIP: es un formato de secuencias de nucleótidos y de residuos de aminoácidos que se utiliza frecuentemente como formato de entrada de diferentes programas o paquetes de análisis tales como: PHYLIP (el cual le dio el nombre), LARD, PLATO, SPOT; entre otros.
  • GenBank: este formato es el utilizado para los reportes de secuencias tanto de nucleótidos como de aminoácidos que se encuentran almacenados en el GenBank. Principalmente se caracteriza por proporcionar al usuario una información bastante completa sobre la secuencia. Los programas del GCG pueden utilizar archivos obtenidos en búsquedas en el GenBank, pero para que esto sea posible, es necesario primero cambiarle el formato al archivo empleando el comando siguiente:

  • Hay una gran variedad o tipos de formatos de archivos o ficheros informáticos.



    En general, podríamos dividirlos en las siguientes categorías:
    * Formatos de
    audio
    : mp3, wav, midi, wma
    * Formatos de
    video
    : mpg, avi
    * Formatos de imagen (ráster): jpg, bmp, png, gif
    * Formatos contenedores y compresión: zip, rar, cab, 7z
    * Formatos de documentos: doc, pdf, txt, xml
    * Formatos de diseño gráfico y vectoriales
    * Formatos de base de datos
    * Formatos de fuentes
    * Formatos ejecutable, código objeto y librerías: exe, com, dll
    * Formatos scripts: php, py, vbs
    * Otros formatos

    :)    XD


    En el siguiente video, se resume el trabajo anterior, el cual lo pueden ver en youtube en la siguiente dirección:



    No hay comentarios:

    Publicar un comentario