Folding @ Home

SystemHacker

Membro

Registrado em: Apr 2010

Posts: 69
- Share
- Tweet
Font Size

#1

Folding @ Home

31-03-2011, 14:10

Não sei se alguem já viu/postou/usa mas poderiamos criar uma equipe do F@H,foruns grandes tem até farms financiadas pelos membros,os clientes do F@H rodam em pc/GPU e em PS3.
Ta aki o link Apenas usuários registrados e ativados podem ver os links., Clique aqui para se cadastrar...
page do F@H do clube do hardware Apenas usuários registrados e ativados podem ver os links., Clique aqui para se cadastrar...
O que é o projeto?

O projeto Folding@home (lê-se folding at rôme) é um projeto da universidade de Stanford que visa compreender como as proteínas se enovelam (fold, dobramento em inglês).

Tudo bem, e daí, porque isso é importante ?

As proteínas são polímeros (do grego poli = muito e mero = parte) compostos por muitos aminoácidos (uma molécula composta basicamente por um grupamento amino, um grupamento ácido carboxílico e um radical, que é variável) de fundamental importâcia para os seres vivos. Músculos, ossos, órgãos, pele, dentes, receptores, anticorpos.. muitas estruturas dos seres vivos são compostas por proteínas.

Os genes são sequências de DNA (sim, ele, o famoso) que codificam proteínas, são as informações lidas por uma enzima chamada RNA Polimerase.
A RNA polimerase lê as informações do DNA e as transcreve para uma fita de RNA (é o irmão do DNA), esta fita de RNA é lida por uma estrutura celular (uma espécie de órgão da celula) chamada Ribossomo.
O Ribossomo traduz as informações do RNA e "monta" uma cadeia de aminoácidos, e assim nasce uma proteína.

Clique aqui para ver no tamanho original.

Essa figura mostra o porque desse processo ser aparentemente trabalhoso demais. O DNA não é lido pelo ribossomo, por isso o processo precisa de um "mediador".
Na figura aparece uma célula com núcleo (chamada célula eucariótica), no caso delas faz mais sentido ter um "mediador" pois o DNA fica protegido dentro do núcleo e precisa enviar as informações para os ribossomos e/ou outras organelas sintetizarem as moléculas que regulam e constituem as células. Nem todas elas são assim. (bactérias por exemplo não possuem núcleo, são células procarióticas)

Imagine o DNA com o diretor de uma fábrica, ele precisa passar as informações para os chefes de setor (RNA) e estes repassarem as informações para que os funcionários da linha de produção (ribossomo) fabriquem os produtos.

Mais aqui, em livros de biologia ou de bioquímica.

Legal, então agora temos a proteína ?

Não, ainda não.

A cadeia polipeptídica (cadeia de aminoácidos) que acabou de ser traduzida (é o nome do processo) do RNA nada mais é que um monte de aminoácidos, não tem função nenhuma pois a função de uma proteína é estritamente dependente de sua conformação espacial. Essa cadeia é chamada estrutura primária de uma proteína.

Para esta cadeia polipeptídica se tornar a proteína ela precisa organizar-se, adquirir uma conformação espacial muito específica onde cada um dos aminiácidos possui um papel importantíssimo no resultado final.

O processo de como esta estrutura primária vai se transformar na proteína, com sua estrutura tridimensional e função é chamado de folding ou enovelamento.

Clique aqui para ver no tamanho original.

O folding não é um processo que ocorre aleatóriamente*, ele depende de vários fatores, inclusive da formação das ditas "estruturas secundárias", que são as alfa-hélices (espiral vermelha na figura acima) e fitas/folhas beta (setas azuis na figura acima), que são estruturas que dependem de quais aminoácidos constituem a cadeia polipeptídica e de como eles interagem entre si. A formação de várias estruturas secundárias resulta na estrutura terciária, que é a conformação final de muitas proteínas. Algumas delas ainda são compostas por mais de uma unidade de cadeia polipeptídica (a Hemoglobina do sangue por exemplo, é composta por 4 sub unidades), formando assim a estrutura quaternária.
Isso tudo, basicamente, são conformações mais estáveis que a inicial.

*Supondo uma cadeia de 100 aminoácidos, onde cada um poderia assumir (em média) 10 conformações diferentes, isso são 10100 conformações possíveis. Se ela tentar se enovelar aleatóriamente assumindo todas as conformações possíveis, e sabendo que o tempo de uma vibração molecular é de 10^-13 s, este processo levaria 1077 anos para que todas as combinações possíveis fossem tentadas. (100 aminoácidos é uma proteína pequena, existem muitas com 600, 1000 e até mais)
Detalhe, uma bactérica chamada E. coli leva 5 segundos pra traduzir e enovelar uma proteína de 100 aminiácidos. [1]

Clique aqui para ver no tamanho original.

Algumas visualizações de estruturas secundárias e terciárias.

Embora muito se saiba sobre as razões das proteínas terem uma conformação X e não Y, pouco se sabe do como este processo se realiza, pois ele é muito rápido, além de não ser possível visualizar uma proteína em "tempo real" dentro das células, quem dirá uma cadeia de aminoácidos.

Mas como os computadores podem resolver essas questão ?

Já faz um tempo que existem pessoas (cientistas, empresas..) que dedicam-se a criar programas, algoritmos, métodos para calcular e/ou simular propriedades de elementos químicos e moléculas (energia total, conformações mais estáveis, pH, lipofilicidade, espectros UV, IV, RMN, metabolismo, toxicidade, interações.. bastante coisa), é um ramo da ciência com vários nomes e áreas, como Química Computacional, Biologia Computacional, Biofísica (não ela toda, mas como parte) e outros ramos que eu não me lembro, mas que adicionarei assim que lembrar, ou me lembrarem .

Um desses métodos chama-se Dinâmica Molecular. (Português - Inglês)

A Dinâmica Molecular consiste em uma simulação do comportamento de várias moléculas ao longo de um determinado espaço de tempo. Tipicamente, apesar de sistemas químicos serem regidos pela Física Quântica, a dificuldade de cálculo associado leva a aproximar o comportamento das mesmas para o esperado pela Mecânica Clássica ou Newtoniana (de forma mais clara: baseando-se na mecânica clássica, a dificuldade de cálculo cresce com o QUADRADO do número total de ÁTOMOS; baseando-se em mecânica quântica, a complexidade cresce com a QUARTA POTÊNCIA do número total de ELÉTRONS). Dessa forma, tipicamente emprega-se física clássica nessas simulações (exceção destacada bem adiante, apenas no caso do core QMD do F@H). Essas metodologias geram uma interface entre resultados obtidos em experimentos de laboratório com as teorias da Física, Química e Físico-Química que possui muitas aplicações no meio científico, basicamente por proporcionar uma visão microcópica dos fenômenos que somente pode ser inferida indiretamente no experimento. O projeto Folding@home utiliza-se de simulações de dinâmica molecular sob diferentes metodologias para estudar o folding de uma proteína.

[Um Imenso obrigado ao johannersrs por este texto !]

Então os computadores resolvem tudo ?

Não.
Os computadores são uma forma bem mais rápida e fácil para a realização deste tipo de experimento, mas eles precisam "ser ensinados" e este conhecimento vem de dados experimentais.
Isso complementa os resultados do projeto ("a evidência não mente", Grisson, CSI) e é muito importante para se melhorar os algoritmos que fazem os cálculos do F@H.
Estes dados experimentais são obtidos por uma técnica chamada Ressoância Magnética Nuclear (RMN) que permite, até certo ponto, que se observe o comportamento dinâmico das proteínas e já foi utilizado pelo grupo, como pode ser visto aqui.

Não seria mais fácil se eles rodassem esses cálculos nos computadores deles ?

Talvez.

Na época que o professor Vijai S. Pande teve a idéia do projeto, em 1999, para simular 1 nanosegundo (um bilionésimo de segundo, ou 1 x 10^-9 segundo) de dinâmica molecular era necessário 1 dia (acreditem em mim, não é balela, pode levar até mais tempo dependendo das condições), e o folding completo de uma proteína ocorre, aproximadamente, entre 5 e 10 milisegundos. (1 milésimo de segundo, ou 1 x 10^-3 segundo), ou seja, levaria entre 5 e 10 mil dias pra terminar um cálculo, de 15 a 30 anos de cálculos ininterruptos.

[O símbolo 10^X significa 10 multiplicado por 10 X vezes, no caso de 10^-X significa 1 dividido pelo número resultante de 10 multiplicado por 10 X vezes]

NOTA: o tempo de cálculo é proporcional ao número de átomos do sistema em uma proporção quadrática. (se dobrar o número de átomos o tempo não será multiplicado por 2, mas sim multiplicado por ele mesmo)

Haja computador..

Então, ponderando isso e também os resultados de outros projetos @home, como o SETI@home e Genome@home o grupo do professor Pande decidiu criar novos algoritmos para que o folding também fosse feito com a abordagem da computação distribuída, que consiste na distribuição de pequenas simulações para vários computadores ao invés de uma grande simulação feita em um computador só.

Então porquê não usar um supercomputador ao invés de ter que contar com a disponibilidade de muitas pessoas ?

Primeiramente pelo custo, um supercomputador custaria milhões, bilhões de dólares, e o grupo não tem toda essa grana. Além disso nenhuma empresa de alma bondosa quis doar alguns bilhõesinhos para que eles montassem um supercomputador. Além do custo inicial há o consumo elétrico do computador e do sistema de refrigeração.

Segundo, os supercomputadores atuais são projetados para que haja uma intensa troca de dados entre os processadores, e no caso do folding isso não se faz necessário, pois os cálculos são, em sua essência, processamento "bruto".

Terceiro, muitos dos supercomputadores atuais não possuem vantagens (em termos de arquitetura) frente aos computadores domésticos, muitas vezes eles são até mais lentos (e quase sempre mais caros).
Isso porque muitos dos supercomputadores empregam AMD Opterons e Intel Xeons (sem esquecer dos que usam os Power e Cell da IBM, outros usam os UltraSpark da SUN) como processadores centrais, e eles possuem a mesma arquitetura dos AMD Athlon64, AMD Phenom, Intel Core 2 Duo/Quad que são utilizados na maioria dos computadores pessoais mais novos.

Quarto, os computadores pessoais são atualizados bem mais rapidamente que os supercomputadores (é bem mais fácil vender um PC doméstico do que 2 mil clusters desatualizados..), além do que, a imensa maioria dos computadores, quando ligados, não utilizam totalmente seu potencial pois estão ociosos (navegando na Internet, escrevendo um texto, baixando arquivos ou mesmo não fazendo nada, só está ligado).

Vamos usar como exemplo o maior supercomputador da atualidade, o Ruadrunner:

Encomendado em 2006 pelo departamento de Energia e Segurança Nuclear dos EUA para ser o maior supercomputador do mundo, custou cerca de 100 milhões de dólares e em seu primeiro teste rompeu a barreira do 1 petaFLOPS. (isso tudo para assegurar a segurança e confiabilidade do estoque de armas nucleares dos EUA..)
É composto por: 6562 AMD Opterons Dual Core (13124 núcleos), 12240 IBM Cell (97920 núcleos), 98 Terabytes de memória RAM, é abrigado em 278 racks do tamanho de uma geladeira, ocupa 5200 pés quadrados (aproximadamente 580 metros quadrados), usa 88 Km de cabos de fibra óptica, pesa 22700 Kg e consome 2.35 MW.

Singelo, não ?

1 petaFLOPS, o que é isso ?

São 1 x 10^15 operações de ponto flutuante por segundo.

FLOPS = FLoating Point Operations Per Second, ou operações de ponto flutuante por segundo. Trocando em miúdos, são operações matemáticas com números não inteiros, que são as operações matemáticas efetuadas pelos programas de dinâmica molecular.

Mais aqui. (em inglês)

Antes que você se pergunte, aqui vai uma tabela com quantos FLOPS outros processadores fazem.

Citação:
Precisão simples @ 3.2GHz
Cell - 230 GFlops (obs: no PS3 uma PPE fica desativada, dando 204 GFlops)
K-7/K-8 - 12.8 GFlops
P-4 - 12.8 GFlops
Core 2 Solo - 25.6 GFlops
K-10 (1 núcleo) - 25.6 GFlops
HD 4870 (referência) - 1200 GFlops

Precisão dupla @ 3.2GHz
Cell - 14 GFlops
K-7/K-8 - 6.4 GFlops
P-4 - 6.4 GFlops
Core 2 Solo - 12.8 GFlops
K-10 (1 núcleo) - 12.8 GFlops
HD 4870 (referência) - 240 GFlops
Créditos para o EduardoS (obrigado por me ajudar com isso =))

(GFLOPS são GigaFLOPS, que consiste em [número] x 10^9 FLOPS)

Multiplicando-se um pouco podemos ver que para se atingir 1 petaFLOP nós precisaríamos de uns 10 mil Core 2 Quads operando a 3.2 GHz.

Mas se todo esse poder de processamento é necessário como que o meu computador vai fazer diferença para o projeto ?

Sabe aquele velho ditado, "de grão em grão a galinha enche o papo" ?

Foi mais ou menos assim que o projeto evoluiu (gráfico com dados até maio de 2008), veja:

Clique aqui para ver no tamanho original.

Com a divulgação do projeto, inicialmente na revista Science, uma das mais importantes publicações científicas do mundo, e posteriormente com vários laboratórios de pesquisa, sites, empresas, grupos criando times e estimulando seus integrantes, visitantes e funcionários a participarem o projeto alcançou proporções nunca antes vistas, quebrando a barreira dos 3 petaFLOPS, com mais de 325 mil processadores ativos no momento e 3 milhões participantes nos últimos dias.

E este número não para de crescer, pois cada dia mais pessoas se familirizam com o projeto e divulgam para amigos, familiares, em seu ambiente de trabalho, e os números vão crescendo.

É realmente impressionante !

Mas se o projeto já conta com tanta gente participando que diferença eu faço ?

Toda !

Quanto mais gente participar, mais doenças podem ser estudadas, os resultados são obtidos mais rapidamente e novas idéias podem ser postas em prática.

Como funciona o projeto ?

É bem simples, você precisa ter o programa (cliente) instalado em seu computador e nada mais, o resto ele faz automaticamente.

O cliente instalado em seu computador, quando iniciado, verifica se há alguma Work Unit (WU, unidade de trabalho) que já foi iniciada.
Se houver ele verifica se os arquivos estão íntegros, pois se não estiverem o cálculo é reiniciado (todo o trabalho é perdido..), se estiverem ele dá continuidade à simulação.

Se não houver nenhuma WU iniciada o "cliente" contacta os servidores de Stanford para baixar uma WU, é um arquivo bem pequeno contendo informações sobre o projeto, as coordenadas dos átomos, a identidade de cada um, com quem eles estão ligados, as condições de temperatura da simulação, propriedades do solvente e outras informações.

Cada WU requer um Core específico para realizar a simulação, se sua máquina não tiver o Core necessário instalado ele também é baixado dos servidores de Stanford.

Os Cores são os programas que de fato efetuam os cálculos. São vários deles para que as pessoas não precisem instalar vários grandes programas de dinâmica molecular em seus computadores, ocupando bastante espaço em disco, sendo também alguns desses programas pagos e nem sempre fáceis de se usar.

São os cores:

AMBER: baseado no pacote AMBER utiliza uma aproximação GB/SA, solvatação implícita, potenciais eletrostáticos em água pura ou com íons.
GROMACS: baseado no famoso programa GROMACS, um dos mais utilizados programas para cálculos de dinâmica molecular do mundo, tira proveito das instruções SSE e SSE2, efetua cálculos com solvatação explícita e é de 20 a 30 vezes mais rápido que o Core Tinker, inicialmente utilizado.
QMD: utiliza o programa CPMD para realizar os cálculos, utiliza algoritmos de mecânica quântica, que são mais precisos porém MUITO mais pesados.
Tinker: foi o primeiro core a ser utilizado, realiza alguns cálculos que o Core GROMACS ainda não faz como solvatação implícita, alguns campos de força e estudos de polarizabilidade. Está gradativamente sendo desativado à medida que o Core GROMACS evolui.
PS3: é um Core específico para quem possui um PlayStation 3.
GPU: Core específico para quem possui placas de vídeo ATI Série HD e posteriorres, e nVidia série 8 e posteriores.

Existem subtipos de cores, sendo cada um específico para um tipo de simulação. Se você tiver curiosidade de saber o que é cada um deles por favor, pesquise aqui: GROMACS, AMBER, QMD).

Agradecimentos

EduardoS, johannesrs, Silver, _teco.

Créditos Evandro

Então fikdika pros admins do clube,ainda poderia ser dado um selo para as maiores pontuações do F@H.
falou galera!

Entre no forum para um debate e não para um Embate!
Faço pages fake,só mandar mp & dinheiro que eu faço
Tags: Nenhum(a)

Top
²=NiXo=²

Programador

Registrado em: Jul 2009

Posts: 211
- Share
- Tweet
Font Size

#2

01-04-2011, 20:40

Eu participei uma vez só mais fico dando lag entao sai xD

Facebook | Hd Virtual | Orkut
|Hospedagem de sites gratis |
Copyright © 2006 ~ 2013
Top
Comment

Anterior template Avançar

Unconfigured Ad Widget

Anúncio

Folding @ Home

Comment