
NOSSAS FERRAMENTAS
SWeeP
Publicação: Camilla Reginatto De Pierri, Ricardo Voyceik, Letícia Graziela Costa Santos de Mattos, Mariane Gonçalves Kulik, Josué Oliveira Camargo, Aryel Marlus Repula de Oliveira, Bruno Thiago de Lima Nichio, Jeroniza Nunes Marchaukoski, Antonio Camilo da Silva Filho, Dieval Guizelini, José Miguel Ortega, Fabio de Oliveira Pedrosa & Roberto Tadeu Raittz (2019). SWeeP: representing large biological sequences datasets in compact vectors. Scientific Reports.
https://doi.org/10.1038/s41598-019-55627-4
Escopo: “Spaced Words Projection (SWeeP)” é um método para representar sequências biológicas usando vetores relativamente pequenos, preservando a comparabilidade interseqüências. SWeeP é o método desenvolvido usa conceito de k-mers espaçados ("palavras espaçadas" ou spaced-words) e denominado aqui por máscaras que escaneiam as sequências gerando índices para criar um vetor de maior dimensão. Mais tarde esse vetor é projetado em um vetor de menor dimensão orientado aleatoriamente em uma base ortonormal.
RAFTS³G


Publicação: Bruno Thiago de Lima Nichio, Aryel Marlus Repula de Oliveira, Camilla Reginatto de Pierri, Leticia Graziela Costa Santos, Alexandre Quadros Lejambre, Ricardo Assunção Vialle, Nilson Antônio da Rocha Coimbra, Dieval Guizelini, Jeroniza Nunes Marchaukoski, Fabio de Oliveira Pedrosa & Roberto Tadeu Raittz. (2019) RAFTS³G: an efficient and versatile clustering software to analyses in large protein datasets. BMC Bioinformatics volume 20, Article number: 392. https://doi.org/10.1186/s12859-019-2973-4
Escopo: RAFTS³G (Rapid Alignment Free Tool for Sequences Similarity Search to Groups) é uma ferramenta desenvolvida com a finalidade de agrupar sequências, tanto nucleotídicas quanto aminoacídicas, em grandes conjuntos de dados sem que haja perda relevante de informação – por exemplo, dividir agrupamentos de sequências com estruturas homólogas, sendo que, se fosse levado a critério o contexto evolutivo dessas sequências, esses genes estariam contidos no mesmo cluster (ou agrupamento).
Sigma 54 Finder


Publicação: L. Ferreira, R. T. Raittz, J. N. Marchaukoski, V. A. Weiss, I. C. R. Santos-Wiess, P. A. B. Costa, R. Voyceik, L. U. Rigo
(2018) The identification of DNA binding regions of the σ54 factor using artificial neural network. https://doi.org/10.1101/393736
Palavras Chave: Artificial intelligence, pattern recognition, feature extraction
Escopo: O Sigma54Finder faz a identificação de genes regulados σ54 para um grande conjunto de genomas, permitindo estudos evolutivos e de conservação do sistema de regulação entre os organismos.
GFinisher
Publicação: Dieval Guizelini, Roberto T. Raittz, Leonardo M. Cruz, Emanuel M. Souza, Maria B. R. Steffens & Fabio O. Pedrosa (2016) GFinisher: a new strategy to refine and finish bacterial genome assemblies. Sci Rep 6, 34963 (2016) doi:10.1038/srep34963
Escopo: O GFinisher é uma ferramenta de aplicação para refinamento e finalização de montagens de genomas procarióticos usando o viés do GC Skew para identificar erros de montagem e organizar os contigs/scaffolds com genomas de referência.
FGAP an automated gap closing tool
Publicação: Vitor C Piro, Helisson Faoro, Vinicius A Weiss, Maria BR Steffens, Fabio O Pedrosa, Emanuel M Souza & Roberto T Raittz. FGAP: an automated gap closing tool. BMC Research Notes 7, 371 (2014) doi:10.1186/1756-0500-7-371
Escopo: O FGAP tem como objetivo melhorar as seqüências do genoma, mesclando conjuntos alternativos ou incorporando dados alternativos, analisando a região do gap e indicando a melhor sequência para fechar o gap.
NtrC Finder


Escopo: O NtrC Finder é uma aplicação web para prever locais de ligação ao fator de transcrição de NtrC (TFBS) em bactérias.O NtrC Finder usa nossa Rede Neural e procura possíveis TFBS em toda a área intergênica nos arquivos GenBank e realiza anotações em um arquivo .gbk. Foram previstos sítios de ligação para 310 replicons diferentes e os resultados podem ser acessados na seção de navegação.
SILA


Escopo: SILA é um sistema de anotação automática para anotação de genomas de bactérias e arquéas. Ele fornece uma predição acurada de genes utiizando uma combinação de ferramentas (Prodigal e HGF) e um site para gerenciamento de tarefas e visualização de anotação.
Dissertação no LINK
Ferramenta HGF no LINK