Evaluation of methods for modeling transcription factor sequence specificity.
PBN-AR
Instytucja
Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego (Uniwersytet Warszawski)
Źródłowe zdarzenia ewaluacyjne
Informacje podstawowe
Główny język publikacji
en
Czasopismo
NATURE BIOTECHNOLOGY
ISSN
1087-0156
EISSN
Wydawca
NATURE PUBLISHING GROUP
DOI
URL
Rok publikacji
2013
Numer zeszytu
2
Strony od-do
126-134
Numer tomu
3
Identyfikator DOI
Liczba arkuszy
Słowa kluczowe
en
Computational biology and bioinformatics
Functional genomics
Transcription factors
Open access
Tryb otwartego dostępu
Otwarte czasopismo
Wersja tekstu w otwartym dostępie
Wersja opublikowana
Licencja otwartego dostępu
Inna
Czas opublikowania w otwartym dostępie
Data udostępnienia w sposób otwarty
Streszczenia
Język
en
Treść
Genomic analyses often involve scanning for potential transcription factor (TF) binding sites using models of the sequence specificity of DNA binding proteins. Many approaches have been developed to model and learn a protein's DNA-binding specificity, but these methods have not been systematically compared. Here we applied 26 such approaches to in vitro protein binding microarray data for 66 mouse TFs belonging to various families. For nine TFs, we also scored the resulting motif models on in vivo data, and found that the best in vitro–derived motifs performed similarly to motifs derived from the in vivo data. Our results indicate that simple models based on mononucleotide position weight matrices trained by the best methods perform similarly to more complex models for most TFs examined, but fall short in specific cases (<10% of the TFs examined here). In addition, the best-performing motifs typically have relatively low information content, consistent with widespread degeneracy in eukaryotic TF sequence preferences.
Cechy publikacji
discipline:Biologia
discipline:Biology
Original article
Original article presents the results of original research or experiment.
Oryginalny artykuł naukowy
Oryginalny artykuł naukowy przedstawia rezultaty oryginalnych badań naukowych lub eksperymentu.
Inne
System-identifier
PBN-R:501792
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych