Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
ATTENZIONE!!!
Come si può vedere anche nell’immagine in alto, mentre si scrive il nome della specie, il sistema propone tutti quelli compatibili
con quello che si sta scrivendo, in sostanza quindi, è indispensabile selezionare la specie nella tabella proposta dal sistema.
- A questo punto, andando a vedere i risultati della nostra ricerca, possiamo vedere che avremo ottenuto solamente 14 risultati
rispetto ai 1,869 ottenuti in precedenza, i quali sono divisi in 1 di Swiss-Prot e 13 di TrEMBL.
ATTENZIONE!!!
Di solito, per ogni proteina umana, in Swiss-Prot otterrò sempre un solo risultato, mentre potrebbero esserci anche diversi
risultati in TrEMBL.
Un’altra cosa molto importante da dire, è che i campi “Protein name” e “Gene name” non sempre corrispondono; in sostanza
quindi, se all’esame venisse richiesto di cercare, ad esempio:
- La proteina “Abl1” noi dovremo cercarla nel “protein name”.
- Il gene “Abl1” noi dovremo cercarlo nel “gene name”.
Riassumendo il tutto quindi, possiamo dire che facendo uso delle parole-chiave, abbiamo imparato ad effettuare ricerche in
UniProt, la banca dati di sequenze proteiche, sia in modo generico che “per campi di ricerca”.
Analogamente a come abbiamo identificato la mioglobina umana, possiamo identificare la proteina ras di ratto, la chinasi Abl di
mucca o l’elenco di tutte le proteasi di E. coli.
Oltre a quanto appena detto, è bene dire due parole anche sul menù:
- Nella foto non si vede, ma possiamo dire che è possibile inserire ulteriori campi semplicemente cliccando su “Add Field”
- Un’altra precisazione da fare riguarda le entries; una volta ottenuti i risultati, ovvero le varie entries, per poter accedere alle
informazioni di una singola entry, basterà cliccare sul codice identificativo:
- In questo modo, verremo indirizzati alla pagina della proteina dove saranno contenute tutte le informazioni:
N.B. “External links” corrispondono alle Cross References.
- Sulla sinistra di questa pagina che si apre, è presente un menu nel quale vedremo evidenziati diversi nomi e cliccandoci sopra
verremo reindirizzati nei punti precisi, sempre della stessa pagina, dove saranno scritte quelle informazioni; in sostanza quindi,
senza scorrere con il mouse.
- Ad esempio, cliccando su “Function” verremo reindirizzati direttamente nella parte della pagina che conterrà questa
informazione:
- E così via per tutte le altre:
Fino ad arrivare verso la metà della pagina, dove troviamo “Sequence & Isoform”, che ovviamente sono accessibili sempre dal
menu presente a sinistra.
In questo spazio, sarà presente la sequenza della proteina che abbiamo ricercato e, se fossero presenti, anche le isoforme; in
questo caso, ad esempio, c’è scritto (nel primo rigo sotto al titolo) che quello che abbiamo cercato presenta 2 isoforme
prodotte da uno splicing alternativo.
Ad esempio, quella cerchiata in rosso è l’isoforma 1, la quale è identificata con il codice univoco della proteina, meno 1 (– 1).
Sotto a questa (non si vede nell’immagine) sarà presente l’isoforma 2, la quale sarà identificata con il codice univoco della
proteina – 2.
Quella presente in basso è la sequenza della proteina in un formato da web serve.
- Se volessimo scaricare questa sequenza proteica, basterà cliccare su “download” (cerchiato in nero), il quale ci fornirà un file
in formato fasta.
Formato fasta
Il formato fasta, sta ad indicare una sequenza nucleotidica o proteica, composta da:
- La prima riga, in cui troviamo un header che ci dà delle informazioni su quello che è contenuto all’interno della sequenza; in
particolare, esso inizia sempre con il simbolo > e poi possono seguire diverse informazioni (identificativo della proteina, nome
della proteina, accession number ecc.)
- Dalla seconda riga in poi, inizierà l’elenco dei residui della proteina (sequenza della proteina) disposti in righe lunghe (di solito)
60 caratteri, (in questo caso, a differenza di quanto visto in precedenza, non sono presenti spazi ogni 10 caratteri).
Per accedere alla sequenza di interesse in formato fasta da UniProt basta seguire il link riportato sopra alla sequenza.
Lezione 3
2 – PubMed
È la banca dati di letteratura biomedica più grande che esista in questo momento; in particolare, “banca dati di letteratura
biomedica” vuol dire che contiene tutti gli articoli scientifici che vengono pubblicati e che possono essere fruibili gratuitamente
o a pagamento.
In particolare, facendo riferimento alla conoscenza acquisita nel corso della storia della scienza, possiamo dire che:
- Una parte si trova nei libri
- Un’altra parte invece, si trova nelle review, ovvero, degli articoli scientifici di “rassegna”; in particolare, un gruppo di
ricercatori studierà approfonditamente un argomento, ad esempio, prendendo gli ultimi 20 articoli che parlano della
trascrizione e, in seguito, scriveranno un unico articolo di rassegna (riassunto) che spiegherà tutte le novità che ci sono state per
quel particolare argomento.
- Tutta la parte nuova, quindi i risultati recenti, si trovano solo negli articoli, che arrivano nelle biblioteche e agli abbonati delle
riviste; in particolare, in gran parte, sono disponibili in rete (gratis o a pagamento).
In particolare, se vogliamo analizzare solamente i dati della letteratura scientifica, basterà andare sul sito dell’NCBI, cliccare in
alto a sinistra e anziché selezionare “All databases” selezionare solo “PubMed”.
Medline, sviluppata dalla National Library of Medicine, è la più completa banca dati di bibliografia biomedica disponibile al
mondo (contiene dati su milioni di articoli); in particolare, l’NCBI, ha incorporato Medline in Entrez (entrez) (un database
dell’NCBI) dando vita così a due database:
- PubMed: costituita da articoli di letteratura biomedica sia gratuita che a pagamento.
- PubMed Central: costituita solamente da articoli completi disponibili gratuitamente online.
Osserviamo il sito di PubMed: è possibile fare una ricerca generica oppure una ricerca per campi tramite “Advanced”.
- Supponiamo di fare una ricerca generica:
- In questo caso, otterrò una serie di lavori che conterranno la parola chiave che io ho cercato.
In particolare, siccome abbiamo fatto una ricerca generica, questa parola chiave, non sarà contenuta, ad esempio, solo nel
titolo del lavoro, solo nell’introduzione, o in altre parti, ma potrebbe essere contenuta, ad esempio, anche all’interno delle
citazioni del lavoro, perché magari, gli autori potrebbero aver preso spunto da un altro lavoro che contiene questa parola
chiave; in sostanza quindi, citandolo, nel momento in cui effettueremo la ricerca generica, come risultato, ci apparirà anche un
articolo che contiene la nostra parola chiave solo come citazione.
Per concludere quindi, è bene dire che è meglio non fare una ricerca generica su PubMed.
- Le informazioni che ci possono interessare da questa prima schermata di PubMed, essenzialmente, sono il numero di lavori
che troviamo (in questo caso, 8555), i quali verranno mostrati in diverse pagine contenenti ognuna 20 risultati.
Sulla destra invece, verrà riportato il numero di pagine (in questo caso, pagina 1 di 428).
- In particolare, quando effettuiamo una ricerca, le prime informazioni che riusciamo ad ottenere sugli articoli presenti in
PubMed, sono essenzialmente:
1- Il titolo, che è un link, quindi cliccandoci sopra si accede direttamente alla pagina dell’articolo.
2- Una riga che contiene il nome degli autori; per quanto riguarda la ricerca biomedica, il nome degli autori è indicativo di
quanto quell’autore abbia partecipato al lavoro e che ruolo ha in quel lavoro.
Ad esempio, i nomi più importanti, sono:
. Il primo nome di un lavoro, è quello che appartiene a colui che ha fatto la maggior parte del lavoro; in particolare, è
possibile avere anche un co-primo nome, in quei casi in cui due persone avranno lavorato in egual modo ad un particolare
progetto.
. Un altro nome importante è anche l’ultimo, in quanto, appartiene a colui che ha avuto l’idea ed ha finanziato il progetto;
anche in questo caso, è possibile avere un co-ultimo nome.
. Tutti gli altri nomi al centro, appartengono alle persone che hanno preso parte al lavoro.
3- Estremi della referenza: ci dicono su quale rivista è stato pubblicato l’articolo e quando (giorno, mese, anno).
4- Codice PMID: è un codice identificativo numerico e univoco per il lavoro (simile all’accession number).
- Come visto per gli altri database, anche per in PubMed si possono fare delle ricerche con diverse parole chiave, in modo da
restringere la ricerca ad output uno meno denso ma più informativo (N.B. è sempre una ricerca generica e non per campi).
Ad esempio, in questo caso, possiamo cercare sempre il dominio SH3 ma nei lavori di “helmer citterich”; in questo caso, la
ricerca sarà “SH3 domain” AND “helmer citterich”, tuttavia, siccome l’AND nelle ricerche è sottinteso, possiamo anche non
metterlo.
Come si può vedere, mentre prima i risultati erano 8555, adesso i risultati saranno solo 10.
- A questo punto, proviamo a selezionarne uno (in questo caso il terzo) e facciamo l’accesso, così vediamo cosa c’è dentro; in
questo modo, si aprirà una pagina di PubMed e possiamo osservare la presenza dell’Abstract che può essere assimilato ad un
“riassunto”.
Come si può vedere, in alto a testa dove c’è scritto “full text links” ci sono dei box che si possono cliccare e in cui c’è scritto
“open access”, il che ci indica che questo articolo è stato pubblicato pagando un corrispettivo alla rivista ma è stato reso
disponibile gratuitamente a tutta la comunità scientifica.
- A questo punto, cliccando su questi link, si accederà direttamente alla pagina dell’articolo, dove ci saranno diverse
informazioni: nome dell’articolo, autori che hanno partecipato a questo articolo ecc.
In questo caso, la persona che avrà lavorato alla rivista (il primo nome) sarà Enrico Ferraro, mentre quella che avrà finanziato
questo lavoro (ultimo nome) sarà Manuela Helmer-Citterich.
. Un’altra etichetta importante è quella del “corrisponding autor”, è l’autore a cui, tutti gli utenti che leggeranno l’articolo,
potranno rivolgere domande (c’è scritto sia l’indirizzo e-mail che il numero di telefono al quale potranno chiedere
informazioni).
. Come si può vedere in basso a destra, c’è scritto che l’art