Publicando datos de proteínas
¿Qué es Uniprot?
Uniprot es una base de datos y recurso en línea que contiene información detallada sobre proteínas de diferentes organismos. Es mantenida por el consorcio UniProt, que combina tres bases de datos principales: UniProtKB (la base de conocimientos principal), UniRef (agrupa secuencias similares en diferentes organismos) y UniParc (almacena secuencias únicas y archiva versiones históricas de secuencias).
Cómo publicar datos en UniProt
UniProt proporciona una interfaz web llamada SPIN. Cualquier secuencia de proteína determinada mediante la degradación de Edman o la interpretación manual de datos de espectrometría de masas es aceptable. Sin embargo, los datos de secuencia derivados mass fingerprinting de péptidos o de cualquier otra técnica de espectrometría de masas que dependa de búsquedas en bases de datos, o cualquier secuencia resultante de la traducción de secuencias de nucleótidos, no serán aceptados y deben enviarse a las bases de datos dedicadas apropiadas.
En caso de ser nuevo usuario es necesario crear una nueva cuenta en la plataforma SPIN. Es importante ingresar un email válido. Los campos a rellenar son:
- Nombre y Apellido
- Contraseña
- Institución
- País
Protocolo Básico: Subir una secuencia de proteína única
Información mínima requerida (RESUMEN)
| Tipo | Ejemplo |
|---|---|
| Protein name (Nombre de la proteína) | Pyrokinin |
| Sequencing method (Método de secuenciación) | Edman degradation |
| Amino acid sequence (Secuencia de aminoácidos) | DPKFSPRL |
| Species of origin (Especie de origen) | Bacteria ferula |
| Citation (Cita) | Warner K., Pichler K., New pyrokinin from a stick insect (In preparation) |
| Confidentiality preference (Preferencia de confidencialidad) | Publish without further notice |
Paso 1: Crear una nueva publicación
Para comenzar a subir los datos a la plataforma, se debe hacer click en “Create new submission”. Una vez iniciado el proceso de publicación, este puede suspender o finalizar más tarde en cualquier momento, haciendo click en “Finish later” al final del formulario.
Paso 2: Indicar el nombre de la proteína
Ejemplos:
- Neurotoxin 4 (Tf4).
- Unknown protein from 2D-page of liver tissue.
- Aspartylglucosaminidase alpha subunit.
Paso 3: Seleccionar el método de secuenciación utilizado para determinar la secuencia de aminoácidos.
En caso de que ninguna de las opciones disponibles se ajuste al enfoque experimental realizados, se puede seleccionar la opción “Other” y describir la metodología en forma acotada.
Paso 4: Especificar el tipo de secuencia, completa o fragmento.
Una secuencia completa puede significar una secuencia precursora completa o, más a menudo, una proteína o péptido maduro y funcional. Por ejemplo, la secuencia de aminoácidos de una proteína secretada menos su secuencia señal se consideraría completa ya que constituye una proteína/entidad funcional madura. Sin embargo, si ha determinado solo los diez aminoácidos N-terminales de una proteína que es mucho más larga, esto se considera un fragmento.
En caso de seleccionar la opción de secuencia fragmentada, luego de completar información sobre dicha frecuencia, se pueden agregar nuevas secuencias fragmentadas
Paso 5: Subir la secuencia de aminoácidos
Si se desea escribir la secuencia de aminoácidos, solo se debe copiar la cadena. En cambio, si se sube desde un archivo, la secuencia puede estan en formato FASTA; si el archivo contiene más de un secuencia en formato FASTA, sólo se reconoce el primero. SPIN acepta los códigos estándar de una letra de aminoácidos, así como los códigos no estándar U (selenocisteína) y O (pirrolisina).
Paso 6. Completar la información del organismo
- Scientific Name (Obligatorio)
- Common name
- Taxonomy ID (obtenido de NCBI)
- Strain (cepa, cultivo o variedad)
- Tissue (tejido o estado de desarrollo)
Paso 7: Añadir la cita
Existen varias opciones para agregar el artículo asociado a la secuencia que se va a publicar
- Unpublished: En caso de que la secuencia no se asocie con ninguna publicación, es necesario dar al menos el nombre de un autor y título.
- Published Journal Article: En caso de que el artículo ya este publicado. Es necesario entregar el título, lista de autores, nombre de la revista, volumen, páginas y año de publicación. De ser posible, también ingresar el Pubmed ID.
- Published Journal Article: En caso de artículos en proceso de revisión, es necesario dar detalles de manera similar al caso anterior pero sin el año ni Pubmed ID.
- Thesis: En caso de ser asociado a un trabajo de tesis. Es necesario entregar el título de la tesis, autor, año, institución y país.
Paso 8: Especificar las preferencias de confidencialidad
Hay tres opciones de confidencialidad que se pueden elegir. Sin embargo, los datos NO pueden mantenerse como confidenciales una vez publicado el artículo o tesis.
- Data may be published without further notice: Se libera después de dar el número de acceso. Puede tomar tiempo para aparecer en la base de datos.
- Data must be kept confidential until publication: Se libera después de ser publicado en un artículo. Es necesario contactar a los curadores dando detalles completos de la cita y asegurar que se libere de manera apropiada.
- Data may be made public after the specified date: Se libera en una fecha específica. Se puede contactar en caso de que sea necesario cambiar la fecha.
En caso de querer subir más de una secuencia se puede indicar en esta sección de comentarios, es necesario subir al menos una secuencia para que los curadores comprendan de que se tratan los datos. Luego se contactarán para pedir un archivo formato FASTA conteniendo el resto de las secuencias, donde cada una de ellas se separa de manera individual incluyendo un encabezado.
Paso 9: Subir los datos haciendo click en “Subimt” o teminar depués haciendo click en “Finish later”
Se generará un correo automático notificando que los datos fueron cargados , luego un curador se puede contactar para hacer preguntas sobre los datos o, en caso de que no existan dudad y los datos son válidos, se enviará el numero de acceso de UniProt
Lista de anotaciones
- Uncertainty in the sequence
- Post-translationally modified residue
- Disulfide bond
- Active site
- Glycosylation site
- Metal ion-binding site
- Nucleotide-binding region
- DNA-binding region
- Other binding site
- Transmembrane region
- Other domain of interest
- Other site of interest
- Sequence variation
Lista de propiedades
- Mass spectrometry
- Function
- Tissue specificity
- Similarity
- EC number
- Catalytic activity
- Cofactor
- Pathway
- Enzyme regulation
- Vmax
- KM data
- Quarternary structure
- Allergenicity
- Subcellular location
- Posttranslational modification
- Induction
- Developmental stage
- Optimum temperature
- Optimum pH
- Redox potential
- Absorption
- 2D-PAGE results
- Miscellaneous
Puedes revisar con mayor detalles las anotaciones y listas en el siguiente enlace: https://www.ebi.ac.uk/swissprot/Submissions/spin/help