<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog WideCom Brasil &#187; WCBScript</title>
	<atom:link href="http://widecombrasil.com.br/blog/index.php/category/wcbscript/feed/" rel="self" type="application/rss+xml" />
	<link>http://widecombrasil.com.br/blog</link>
	<description>Gerenciando Soluções Web</description>
	<lastBuildDate>Wed, 01 Jun 2011 15:31:07 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Comunicado: Queda de servidores</title>
		<link>http://widecombrasil.com.br/blog/index.php/2011/06/comunicado-queda-de-servidores/</link>
		<comments>http://widecombrasil.com.br/blog/index.php/2011/06/comunicado-queda-de-servidores/#comments</comments>
		<pubDate>Wed, 01 Jun 2011 15:31:07 +0000</pubDate>
		<dc:creator>Thiago Voltolini</dc:creator>
				<category><![CDATA[Atualizações]]></category>
		<category><![CDATA[Comunicado]]></category>
		<category><![CDATA[WCBScript]]></category>

		<guid isPermaLink="false">http://widecombrasil.com.br/blog/?p=113</guid>
		<description><![CDATA[Na madrugada do dia de hoje, 01/06, alguns clientes notificaram queda do servidor ou lentidão muito grande impossibilitando qualquer tipo de acesso. Uma verificação primária dos logs do kernel confirmaram load elevado, com consumo de processador ou memória em 100% momentos antes do reboot. A princípio achamos que foi causado por algum tipo de aumento]]></description>
			<content:encoded><![CDATA[<p>Na madrugada do dia de hoje, 01/06, alguns clientes notificaram queda do servidor ou lentidão muito grande impossibilitando qualquer tipo de acesso.</p>
<p>Uma verificação primária dos logs do kernel confirmaram load elevado, com consumo de processador ou memória em 100% momentos antes do reboot.</p>
<p><span id="more-113"></span> A princípio achamos que foi causado por algum tipo de aumento na carga do Apache junto com o PHP. Todo dia primeiro e quinze do mês nosso relatório de checagem é executado no servidor e além das checagem ele faz também a atualização do kernel e demais componentes através do yum. Consideramos a hipótese de que algum componente tinha sido atualizado e passou a causar a instabilidade, já que todos os servidores haviam mostrado a instabilidade aproximadamente no mesmo horário.</p>
<p>Um acompanhamento foi feito nestes servidores durante a manhã e derrubando a primeira hipótese, não houve instabilidade em nenhuma das máquinas afetadas. Partindo ainda do horário muito próximo em todas as máquinas e sendo este horário próximo à execução do relatório executamos testes nas funções do relatório separadamente. Os testes acusaram a causa da instabilidade nos servidores e confirmamos.</p>
<p>Há duas semanas implementamos uma série de testes novos para garantir a checagem e integridade dos discos do servidor, onde os testes nos informam o tempo de vida do disco, verifica badblocks, status da &#8220;saúde&#8221; dos discos, desempenho, entre outros. Por algum motivo estes procedimentos, que em nosso ambiente de testes foram bem sucedidos, entraram em loop chamando a si mesmos dentro do próprio processo o que acabou por consumir memória e processamento do hardware.</p>
<p>Não foram afetados todos os servidores, a maioria conseguiu executar os testes normalmente sem qualquer erro ou instabilidade no sistema, porém ainda não identificamos quais as diferenças entre os dois grupos de servidor que podem ter causado tal erro, todos rodam no mesmo SO, na mesma versão, mesmo kernel.</p>
<p>Tais funcionalidades foram removidas do script, serão reavaliadas e passarão por novos testes. O script já foi atualizado em todos os servidores, afetados ou não.</p>
<p>Peço desculpas em nome da equipe a todos os clientes e colaboradores afetados pelo nosso erro.</p>
<p><strong>Thiago Voltolini</strong></p>
<p><strong>WideCom Brasil</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://widecombrasil.com.br/blog/index.php/2011/06/comunicado-queda-de-servidores/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

