Disponíve* em:
http://editora.unoesc.edu.br/i*dex.php/rac*
Race, Joaçaba, v. 14, n. 1, p. 1*1-*9*, *an./abr. 2015
DESCON*I*UI*ADE DE EMPRESAS
*RASILEIR*S DO SE*OR DE MATERIAL
BÁSICO: NO PERÍODO COMPREEN*IDO PRÉ
* PÓS A CRISE DO SUBPRIME
Disconti*u*nce of bra*il*an com**nies of basic m**erials sect*r: the period
*re an* p*st the sub*rime crisis
R** Amér*co Mathia*i Ho*ta
E-ma*l: *ui.hort*@ufjf.edu.br
Doutor em *ng*nharia Civil pe** *niversid*de Federal do Ri* de Janeir*; Pro-
fessor A*junto do Departa*en*o de Finanças e C*ntrolado*ia *a Univer**dade
Fe*er*l de Juiz de F*r*; *ua José L*urenço Kelmer, s/n, *a*pus Unive*sitário,
São *edro, 36036-900, Jui* de F*ra, Minas Gera*s, Br*si*.
Fran*isco José *os *a*tos Alves
*-mai*: fjalves@globo.*om
Doutor em Controladoria e Co*tabilidade pel* U*i*e*si*ade d* São **ulo; Pro-
fessor Ad*u*to do *epartamen*o de Fina**a* na Universidade do Esta*o do Ri*
d* Janeiro.
C**l*s Cr*stiano H*senclever **rges
E-ma*l: cchb@l*cc.br
Dout*r em E*genharia *ivil pel* Unive*sidade Fe**ral do Rio *e Janeiro; Pro-
f*sso* A*junto do Departamen*o *e Ciênc*as da Co**utaçã* da Universidade
Fede*al de J**z de Fora.
Adriano Rodrigu*s
E-mail: a*riano@facc.ufrj.br
Doutor *m Cont*o*adoria e C*ntabilid*de d* U*ive*sidade de São *aulo; Profes-
sor Adjun*o do Depar*ame*t* de Ciê*cias Contábeis da Un*versidade *ed**al do
Ri* de Jan*iro.
Ar*i*o rec*bido em 09 de maio d* 201*. Aceito em 04 de a*osto de 2014
171
R*i **ér*co Mathia*i Horta et al.
*esu*o
Descontin*idade de em*resas é um tema cada vez mais e*tu*ad* no campo da contabilidade,
da* finan*as, d*s negócios e da computação *m decorrên*ia d* consider*vel impacto social
causado pe*o fracass* *orporativo de uma entidade. Ba*c**, in*estidor**, aud*to*e*, *erentes,
f*rnece*ores, emp*egados e mui*o* outros *êm grandes interesses na *c*r*cia da previ*ão
de continuid*d* *e *m* *ompanhia. Ain*a há questões pouc* es*udad*s na mode*agem de
pr*visão d* insolvência. O desequilíbrio ou desba**nceamento dos d*dos sobre insolvência é
u*a *essas qu*stões; em a*b*e*tes econômicos típicos o núme*o de empr*s*s classificadas
com* solven*e* é bem maior do que o daquel*s cl*ssificada* co*o insolven*es. O objeti*o
deste *s*ud* *oi c*m*a**r as var*áve*s **ntá*eis *e*ecio*adas *as amostra* d** empres*s do
se*or de ma**r*al básico a*tes e após a crise do subpr*me, aplicando tecnologias de apren*izagem
de máquinas em probl*mas de previsão de insolvência, ut*lizan*o técnicas de balance*mento
da b*se d* dados *o* (etap* de) seleção de atributo* *, a pa*tir disso, o*ter informaç*es
contábeis que levem a explicações d** diferenças ocorr*das na descontinuid*de das *mpresas
estudada*. Esta pesquisa é de natureza ap*icada c*m ab*rdagem quantitativa; q*anto ao
*bjetivo, é d*scritiva. A *ase d* dado* foi or*ginada de demonstrati*os contábeis de emp*es*s
brasileira* do setor econômico d* material bá*ico, listadas n* Bovespa e na Se*asa entre os
anos 19** e 2006 e 2007 e *012. Os result*dos obtidos evidenci*r*m a alt*r*ção de algumas
variáv*is seleci*nadas para a carac*eri*a**o daquelas empr*sas qu* se tornar*m desco*tínuas.
Empresas do set*r d* m*ter*al básico, *o período estuda*o, 2*07 a 2*12, que se ade*ua*am
às *xigênci*s d* mercado, privil**iando a l**uidez em detri*e*to ao opera*ion*l, l**raram
sucesso em *u* continuidade.
Palavras-c*ave: Descont*nuidade de em*resas. Se*eção de var*áv*is c*ntábe*s. Balanceame*to
de b*se de dados. Tecnolo*ias d* ap*end*zagem de máq*ina. Set*r de m*t*rial básico. *r*se
*u*prim* Brasil.
Di*continua*ce of br*zilian co*panies of basic materi*ls sector: t*e period *re and post the
subprim* *risis
Abstr*ct
Disco*tinuity of companies is a topic incr*asingly st*died i* *he *ield of accoun*ing, fin***e, busi*ess and
c*mputing due to the *onsi*e*able so*i*l i*pac* caus*d *y failure of a corporate entity. B*nks, investors,
**ditors, managers, *uppliers, em*loy*es and **n* others hav* great int*rests in the acc*ra*y of prediction
of continu*ty o* a compa*y. There is st*ll little s**died is*ues in pr*dicti*e modeling of insolvency. The
im*alanc* *r unbalance *ata in*o***n*y *s one *f *hose i*sues, in typi*al e*on**ic environ*ents the number
of companies cl*ss*fi*d as solvents is much greater *han those cl*ssified as insolvent. *h* ai* of t*is study
wa* to *omp*r* *he accounting *a*iables selected in t*e samples of compani*s i* t*e basic *ate*ials sect**
be*o*e and after *h* subprime crisis b* app***** machin* learning technologie* in problems of insolvency
prediction, **ing balanc**g *echniq*es with d*ta*ase (*t** a) sele*t*on of at**ibutes. The*eafter, obtain
accoun*ing inform**io* l*adi*g to explanations *f the diff*renc*s arising in **e discontin*ity of the co*panies
172
*esc*nt*n*id*de de empresas b**s*leiras...
studie*. T**s resea*ch is *f an *pplied *atur* *i*h a quantit**ive ap**oach; about the objec*ives, it *s
e*plorator* and explanator*. The databa*e was derive* f*om *ina*cial sta*emen*s of Brazilia* *o**anies
i* the basic materia*s econ*mic *ector, list*d on th* B*VE**A and *ERASA between the yea*s 19*4-
2006 and 2007-*0*2. Th* resu**s showed al*erati** of ce**ain sele*t*d t* c*aracterize those co*panies that
have **c*me di*co*tin*ou* variables. C*mp*ni*s in th* bas** *aterial* sector, dur*ng t*e study period from
2007 to 2012, that suited the *equi*ements of the market, focusin* on liquidity rather t*an the operational,
ma*aged to s*cceed in its conti*ui**.
Keywor*s: *iscon*inuanc* of busin*ss. *e*e*tion *f accoun*ing *a*iabl*s. Balancing data*ase. Machine
le*rnin* *echn**o*ies. **sic mat*r*al sect*r. Subprime crisi* - Br*zil.
* IN*RODU*ÃO
*ada vez mais o desenvolvimento d* est**o* sobre modelage* p*ra
previs** de descontinuid*de de empres*s vem adquirind* *mportâ*ci* n*s áre*s
relat*va* à *ontabi*idade, Finanças, Ne*ócios e **mputaç**. De fa*o, a previsã*
d* insolvê*cia permit* antecipa* um* situação *inancei*a dif*c*l, *e forma q*e haja
temp* hábi* para serem adotadas medidas c*pazes de rev*rt*r a s*tua*ão, impedi*do
a oc*rrên*ia de grandes custos sociais e fina*c*iros.
Vários f*tores têm concor*ido pa** o aum*nto quantitati*o e q*alita**vo
dos estudos sob*e o t*ma. Por e**mplo, em vári*s países, a m*ioria das esta*í*ticas
sobre *alê*c**s mostro* significativo cr*scimento. A*ém di*so, *as ú*timas década*
o am**ent* econômico gera* das emp*esas, *a maio*i* *os países, tem mudado
com enorme velocidade * experime*tado ten*ênci*s adversa*. C*esc*u, também,
a *autela *ss*ciad* * imp*ementação d* norm*s i**ernac*o*ais de con*ab*lidade
(IFRS) e finanças, Basiléia II e III, Solvê**i* II e Sarba*e*-Oxle*.
Como sempre ocorre, *pesar das inú*eras *e*qui**s *a área, há ainda
q**st*es pouco e**l*ra*a* como a nã* est*c*ona*ieda*e e a inst*bilid*de dos dados,
a seleção *a amostra e o de*equilíb*io entre as cl*sses (BALC*EN; OOGHE, *006;
TSA*; *U, 2008; NANNI; LUM*NI, 2*09; GESTEL; B*ESENS; MARTENS,
20*0; ZHOU, 2013; S*N et al., **14).
Uma dessas questões pouco exploradas é o problema do **sequ*líb*io d*
tamanho das classes inicial*ente d*sponíveis quando se observa a separ*ção *nt*e
em*res*s solven*es e insolventes. **be re***hecer q*e essa situaç** é
n*tural,
porqu*, normalment*, em qualquer soc*edade, a classe d* empresas i*solv*ntes é
muito in*erior à de *olv*ntes, indepe*dentement* do período que s* analisa. *or
i*so mesmo se requer um *ratame*to **al*tico ad*qu*do para evita* que "[...]
*s
modelos de prediç** sejam pouco efetivo*, pr*dizendo bem somente o qu* ocorr*
173
Rui A*ér*co Mathiasi Ho*ta *t al.
com a classe majoritária." (JAP*OWICZ; *TEP*E*, 2002, *. *31). No c*s*
da
*icotomia "so**ente/insolvente", ress*lt*-se que, a classe minori*á*ia é exatamente a
que d**a*d* mais aten**o.
A sol*ção para o prob*em* de desba*anceament* em cl*ssificação de dados
pode ser considerada relativamen*e n*va, en*re "[...] as r*s*ostas qu* su*giram
quando as id*ias rel**ionadas à aprend*z*gem de *áquina (machi*e learning)
*ornar*m-se uma t*cnologia efetiva*ent* a*li*ada e amplam*n*e utiliz*da
em
áreas como negóc*os, indústria, linguísti*a, b*oin*or*ática entr* muitas ou*ras."
(C*AWLA; JAPKOWICZ; KOLZ, 2*04, p. *).
Por outro lado, a cri*e p*ovocada p*la *oncessão de créditos hipo*ecári*s
com elevado risco, acrescido do us* de derivativo* c*ja *plicação nesse t*po
*e
financi*me*to encontrava-*e des**g**amentada pelo Estado, gerou *os Estados
Unid*s mais de 26 milhões de american*s d*sempreg*dos. Cerca de 4 milhões de
família* perder*m su*s casas * *utr*s 4 milhõ*s *ofrera* aç*es j*diciais de *espejo
(*N*TE* STA*ES OF AMERICA, 201*, p. 15).
Essa crise e*idenciada a partir de 2007 *e*enc*deou um *fei*o dom*nó
no mer*ado fina*c*iro e, posteriormente, na economi* re*l. *s op*rações com
deri*ativos e a fal*nc*a *e g*and*s ba**os *e investi*ent* geraram um efeito
d*
restrição de crédito e i**actaram n*gativamente t*das ** *rincipa*s e*onomias
mundiais (C*OUHY; JA*ROW; TURNBU*L, 20*8).
O e*ei*o chego* ao Br*sil ainda em 2007: o *bovespa encontrava-*e acima
*e 60.00* pontos e chegou a fica* abaixo de 30.000. O Governo bra*ileiro te*e que
estabelecer *ma série de po*íti*as p*ra e*itar a cris*, *omo, por exempl*, alterações
de taxas de j*ros e també* *os t*ibutos. A*enas em 200*, o p*incipa* índice
*a
BM&FBovespa retorn*u a patamares pr*ximos *o **rí*do a*teri** à crise (COSTA;
REI*; TEI**IRA, 2012).
Nesse contexto, este estudo t*ve por objetivo com*arar as vari*veis contá*eis
selecion*d*s nas amos*ras d** empre*a* do set*r de material básico de a*t*s * ***s
a cr*se do subprime (2007), *plican*o t*cnologias de apren*izag*m *e máquinas em
problemas d* pr*visão de *ns**vên*ia, utilizando técnicas *e bal*n*eamento da base
de dad*s com (e*apa d*) seleção de a*r*bu**s e, a p*rti* disso, obter informações
contábeis qu* leve* a explicaçõe* das di*erenças ocorr**as *a descontinui*ade das
empresa* do setor econômico estudad*.
Esta **squisa é de natureza aplicad* c*m ab*rdage* quantitativa; quanto
ao* objetivo*, é exploratória e ex**icativa. Ut*lizaram-se dados obtidos
em
174
Desco*tinuidade de empresas bra*ileiras...
demonstrativo* contábeis de empresas *lassi*icadas na Bol*a *e ***ore* de S*o Paulo
(B*vespa) e Serasa, pertencentes ao setor econômico d* ma*erial básico.
A utiliza*ão *e uma base empírica apoiada e* *emonst****v*s cont*b*is s*
justifica pl**amente pe*o press*posto d* qu*
[...] na previsão de *nsolvências, os princip*is ind*ca*ores ma-
croeconô*icos (p. ex., *n*lação, *uros, impostos, e*c.), junta-
mente com as características *as em*resa* (conco*rên*ia, ges-
tão, ca*acidade *ro*utiva, produto, etc.), es*ão devidamente
refletid*s na**eles demons*rat*vos, d* ta* m*d* que * f*tura
situaçã* financeira d* *mpres* pos** ser previst* usando da-
*os deles para al*mentar *écnic*s de modelagem
avançadas.
(GE*T**; BAESENS; M*RTENS, *010, p. 295*).
Já em *e*ação à crise do subprime, ela c*me** * ficar bem evidente p*r meio
da queda dos pr*ç*s dos imó*eis nos *stado* U**do*, desenca*eando u* efeito
domin* no me***do fina*ceiro e, posteriorm*nte, na ec*nomia real. O sub*rime
é *m **rmo empregado pa*a desi*n*r uma forma de cr*dito hi*otecário (*ortgage)
para o set*r imobiliário, surgida nos E*tados Unidos e destinada a t*madores
de
empr*stimos *ue repr*sen*am maior risco. *sse c*é*ito imob*liário tem como
garan*i* a resid*ncia *o t*mador e, muitas ve*es, era acoplado à em*ssão d* cartões
*e c*édito. De uma forma ampl*, o subpri*e é um *r*dito de r*sco co*ced*do a um
tomador que não o*e*ec* garantia* sufi*iente* para se beneficiar da tax* de *uros mais
va*t*josa (*rime ra*e). A* ope*ações com derivati*os e a falência de g*andes bancos d*
investimento ge*aram um efeito *e *estrição de cré*ito e impact*ram *egativame*te
to**s as principais economia* mundiais (C*OUHY; J**ROW; T*RNBULL,
2008). O e*eito chegou ao *rasil ainda em 2007: o Ibovespa enc*ntrava-se acima
*e 60.000 pontos e chegou a ficar abaixo de 30.000 **nto*. * Governo brasileiro
te*e q** esta*elecer uma série de políticas para evitar a crise, como, por exemplo,
al*er*ç*es d* taxas de juros * t*mbém dos t*ibu*os. Apenas em 2009, o principal
índi*e da BM&FBovespa retornou a pat*mares *r*x*mos do perí*do *nterior à crise
(COS*A; REIS; TEIXE**A, 2012).
O a*t*go está org*niza** em cinco seções, incl*i*do esta Introdução. A
seçã* 2 ap*esenta a revisão bibliogr*fica *ue forn*ceu sup*rte ao desenvolvimento
da pesquisa. Na terceira seção, descrevem-se os *rocedimentos meto*ológic*s
a*otado*. N* *eç*o 4, a*resentam-se os resultados obtido*. Na qu*nta e últim* seç*o
s*o *xpostas algumas análises e c*ncl*s*es *a pes**is* sendo também *uger**os
futu*os estud*s.
1*5
Rui A*érico Mathiasi Horta e* a*.
* FUNDAMENTAÇÃO T*ÓRI*A
A previsã* de insolvência tornou-se * as*un*o mais pesquisado e dif*ndido
na d*cada de 196*, notadamente por meio do modelo *hama*o Esco*e-Z (A*TMAN,
1968). Alt**n, Haldem*n e N*rayanan (1977) d*senvolveram um *ovo modelo de
*lassif*cação de **solvênci*, chamado Zeta, uma atu*liza*ão * a*rimo*am*nto do
modelo Esco*e-Z orig**al; em *mbos os **tudos foi utili*ad* a an*li*e dis*rim*nan*e.
Martin (1*77) e*aborou um mode*o de *revisão em que *ti*izou regressão
*ogística. *hlson (1980) em*r*gou modelo log*t para previsão de f*lênci* de empresas.
Wes* (1985) utilizou análi** fatori*l par* *elecionar * espe*ifi*ar as v*riáveis. Ca*bas,
*abu* e Kilic (2005) combina*a* aná*ise **scri*in*nte *inear (LDA),
r*gre*são
lo**stica (*L), probit e an*lise d* comp*n**tes principais e* **a mod*lagem da
i**olvência.
M*is recentemente, es*ratég*as *a*eadas e* t**nologias *omputaci*nais
começ*ram a ser aplicadas visando à *etecç*o de insol**ncia. S*in, *ee e Kim (2005)
invest*gara* a efi*ácia da aplic*çã* de Máquinas de Vet*r Suporte (SVM) para
*
*roblema de previsã*
de falên*ias, mo*trando qu* o classificado* SVM supera as
re**s neurais (ANN) e* prob*e**s de *r*v**ão d* fal***ias de empresas. M*n, Lee
e Han (2006) propuser** métodos para me*horar o desem*enho de SV* em dois
*spectos: a se*eção de atributos e a otim*zação de parâ**tros.
Alguns autores, vi*ando aumentar a eficácia *a pr**ição, ta*bém
desenvolveram m*todologias específica* no uso dos class*fic*dores o* na
manipulação *a* *ases de dado*. Por exemplo, Atiya (200*) desenvolveu um estudo
sobre previsão de insolvê*c*a em que aplica r*des neurais e* *m *as* de ba**os
de dados desbalanc*ad*s. Em busca de maior precisã* nas p*evisões, Tsa* e Wu
(200*) c*mpararam o desempenho de um cl*ss*ficador simp*es *e *NNs com
o d* múltiplos cl**sific**o*es, também bas*ados em ANNs. Fazendo apli*a*ão
d* comit** de classificadores, Ravi et al. (2*08) e*abora*am e t*stara* *o*elos
utilizando comitê de classifica*o*es para pr*visão *e *nsolvên*i*. Nanni e Lu*ini
(2009) des*nvolvera* uma metod*logia de mineração de *ado* ***a a
previ*ão
de insolvê*cia *e e*presas italianas. Hun* e Chen (**09) aplicaram um modelo
de pro*abilidades híbridas, bas**do em co*itê de c**s*i*icadores, par* previsã* de
ins*l*ên*i*, utiliza**o votação major*tá*ia e vota*ão ponderada.
No Brasil, ainda * not*ria a e*c*ss*z de pesquisas de*e*volvidas c*m o
propósito ** encont*ar parâm***os para previ*ã* *e in**lvê*cia, além da persi*te*te
escassez *e dados adequa*os e confiáveis para a real**ação de*s* tip* de *studo. Essa
176
Descontinuid*de de empresas brasileiras...
situ*ç*o começa a *er mudada, m*s, em comparaçã* à facilidad* *e obtenção
de
da*os que ocorre em o*tr*s paí*es, ainda se está bem longe de po*e* desenvolver
tais estudos com fluidez. * segui*, são revistos a*g**s trabalhos de *ai*r rele**n*ia
aplica*os em dad*s de empres*s brasi**ira*.
T*dos como dest*cad*s p*ecursores, Elizabe**ky (1976), Kanitz (197*) e
Matias (1978) tra*alharam em mo*elos de *re*isão de inso*vênc*a utilizando aná*is*
discriminante. A metodologi* dos tra*alhos seguintes - por exemplo, Altman, Baidya
e D*as (*97*) - também recorreu à ferramenta estatística *e análise d*scrimi**nte,
bem como Sanvicente e M*na*di (1998). Morozi*i, *linq*ev*tch e Hein (*006)
uti*izam análise *o* componen**s pri*cipais par* combinar o* p*incip*is í*dices entre
os se*ecionados *ara o estudo. *ilv* Brito, Assaf Neto e Corrar (2009)
utilizara*
reg*essão logística para examinar se eventos de *efault de *m*resas ab*r*as no Bra*il
podem ser a*equadamen** previst*s *or um *istema de cla*sificação de *isco de c*édito
baseado em índices co*tábeis. Horta (2010), *til*za*do dados contábeis d* empres*s
b*as*le*ras, propõe-se a resolver o pro*l*ma *o desbal*nceamento entre as cla*ses *e
em*r*sas solvente* e i*solvent*s exist**te em est*d*s de previsã* de insolvência.
3 METO**LOGIA DA PES*UISA
Este estu*o tem c*mo o*jetivo comparar as variáv*i* selec*ona*as nas
amostra* das *mpresas do se*or de m**eri*l ***ico d* ant*s * após * crise do subprime
(*007), ap*icando tecnologias de aprendizagem de máqu*nas e* pr*blemas
de
previ*ão de in*olvênc*a, ut*li*ando técnicas de bal*nceam*nto da base de dados
com (etapa de) seleção *e atributos e a partir disso, obt*r inf**mações contábeis
que levem a ex*licações das diferenças ocorridas na descontinui*ade das empres*s
do se*or e*onôm**o e*tud**o. Esta pe*quisa é de *atureza aplicada com abordagem
quantitativa; quanto ao o*jetivo, é desc**tiva. * seguir são apr*sentados os passos
metodológico* cumpr**os para alc*nçar * objet**o.
3.1 B*SE DE DADOS E MÉTRIC*S DE AVALIAÇÃ*
Foram obtidos nos demonstrat***s contábeis ** empresas, publicados na
Bo*e*pa, 23 i*dicador*s c*ntábeis anuais das empr*sas do setor de material básico,
cl*ssificad*s de a**rdo com grupos d* índices contábeis-financeiros: *iquidez,
en*ividamento, rentab*lidade e ciclo o*er**ional (APÊNDIC* A). Na visão
de
177
Rui Am*rico M*thia*i Hort* et al.
Wolk, Dodd e Rozycki (*0*3, p. 304), "[...] variáveis cont*beis são muito usadas
para dis*ri*inar empres*s que ap*esentam tendências *e s* *ornarem i*so*ventes
daq*elas s*lventes."
Importa, aqui, evid*n*ia* a impo*tâ*cia e os prin*ipais motivos da e**olh*
d* um conjunt* de e*presas pert*ncentes a um mesmo set*r ec*nômico. Para
I*dícib*s (*009, p. 91), "[...] os demonstrat*vos *ontábeis de empresas do mesmo
*etor *co*ômico ap*esentam sem*lhanças devid* a s*as e*truturas p*tr*m*niai*
e econômicas. Indicadores ta*s c*mo l*quid*z, *ndivid*mento e rent*bilidade
*everiam *p*esentar va**res bem próxim*s, em termos da média *etorial."
Co*põe* *ste setor empresas dos su*setores ** embalage*, m*de*ra e
pap*l, *ate*iais diversos, m*neração, químicos, siderurgia e metalu*gia. *esse setor
econômico, a* **pre*as ap*esentam, normal*e*te, *alores proporcionalmente altos
em seus ativ*s *ão circulantes; em empresas, *obretudo do* seto*es d* madeiras e
papel, químico*, sider*rgia * metalur*ia, ess*s ativos sã* sub**anci*dos pel*s *ti*o*
imobi*izad*s (ins*alações, equipamentos, **quina*, e*c.). Empresas de*se
setor
*oram as esco*hidas em de*orrência do baixo índice d* tamanh* de s*us
ativo*
intan*ív*is (MOURA e* al., 2013, p. 131) e, po* consequência disso, u* dos s*tores
m*is vulneráveis *os efeitos da crise.
Na mon*agem da **se de *ado*, cada uma das empr**as foi classificada
como conco*datár*a, *m recuperação judicial ** falida na Bov*spa, durante
o período de 2007 a 2012. Para cad* empresa cl**sificada como *ns**vente foi
adicio*ada uma quanti*a*e s*pe**or *e emp*esa* de c*pital a*erto, **m control*
p*iv*do nacional, fi*an*eir*mente saudáv*is (no sentido de que não ha*ia solicita*ão
de c*ncordata po* p*rte da e*presa no período c*n*iderado). O estabelec*m*nto de
u*a quantid*de superi*r de e**res*s a*imp*e**es para cada inadi*plente baseia-se
n* hipótese de "[...] q*e algum *vento que d**enda de um conjunto de vari*veis
*leat*rias c*jo nú*ero aumenta sem lim*t* e cada uma das **ais tem ape*as *m
efeito insi*nif*c*nte ** conju*to, ocorrerá com probabilidade t*o próxima de u*
quant* d*s*jado" (GNEDENKO, 2*08, p. **9) a*ém de representar melhor a
reali*ade econômica.
Fo* utilizada anál**e de da*os em painel, *oi* segundo Pindi*k e Ru*infeld
(*004) e Gujarati (20*6 a*ud. FÁVERO et al. (*009, p. **2), as *rincipa*s
caracte*ísti**s da *nálise de dados *m painel são: ma**r número de *bservações
para se trabalhar, *om con*eq*ente *umento do n*mer* de graus de l*berdade
e
ef*ciência dos parâm*tros, red*ção de *ro**emas de multicol*ne**idad* de variáveis
e**licativas e e*istência da dinâmica *ntert*mporal. E* modelos de p*evisão de
*78
Descon*inuidade de *mpre*as *rasi*eiras...
i*sol**nci* e*ab*rados com *ado* em painel, cad* empresa fornece dados contínuos
durant* perí*dos (anos) (HUNG; CHEN, 2009, p. 5301). N* aná***e de dados
em p*inel pela facilidade de acesso a uma maior quantidade de dad*s obtidos no*
demo*stra*i*os *ontábeis, em ra*ão da criaç*o de in**ância *m quan*idad* bem maior
do que o número de *mpre*as, as apl**ações e os estudos nes*as ba*es acabam p*r
a*resentar melhores re*ultados. Diss*, a su* pref*rência e utilizaç*o (*ALCAEN;
OOGHE, 2006, p. 69).
*stud*s tradicion*is de previsã* *e continuidade utilizam o* *éto*os de
estat*sti*a conven*ionais, com* análise discr*m*nante m*lt*pla, logit e pro*it.
N*
en*a*to *sses métod*s apresen*am *lgu*as hip*te*e* restritivas, como a linearidade,
a nor*al**ade * a *ndependência do* preditor*s ou var*áveis de entrada. Considerando
que a violaçã* dessas premissas o*orre com frequênc*a com o uso d* d*dos *i*anceiros
(YEH; CH*; *IN, 2*14, *. 98), a*ordagens de a*ren*izagem ** máquin* (*M), *omo
a árvore de decisão (AD), são menos vulneráveis a ess** violações. *M pod* ser uma
*lternativa de *olução pa*a p*obl**as de cla*sificaç**, uma vez que ela demonstrou
te* capacidade predi*iva superior aos mét*dos *s*atístic*s convencionais de previsão d*
*o*tinui*ade (Y**; CHI; LIN, 20*4, p. 99).
*o presente estu** *or*m utili*ad*s técn*cas de aprendi*agem ** máquina
* o SEIDWS (HORTA, *010) **ra s*l*cio*ar o problema do desequilíbrio en*re a*
cl*ss*s de emp**s** c*assificadas com* solventes e inso*v***e*, a*ém de mi*orar os
*roblemas de classi*icação quand* da *tilização de técnicas tradicio*ais. Com isso,
buscou-s* representar me*h*r o *mbiente econ*mico das empresas. *ale ressalt*r
que n*o se conhe** estudos com da*o* cont*bei* de empresa* *r*sileiras
qu*
utilizara* tai* f*rr*mentas, se** em sepa*ado ou em *on*unto.
Na base d* dados es*uda*a há *0 instân*ias representando as emp*esas
insol*entes e 180 re*re*entand* as solventes d* mesmo *etor, n* pr*po*ção de *8 para
1. P**a se cheg*r a essa prop*rção, adotou-se a seguint* es*ratégia: *rimei*o fora*
obt*dos um mai*r nú*ero possív*l de *mpre*a* cla*s**ic*das c*m* *nso*ventes e q**
ap*esentavam demonstr*t*vos cont**eis co*fiáve** e adequados de serem *studados
(d*monstrati*os contábeis pu*lic**os na Bovespa/CVM), a seguir, foi obtido *
ma**r número possív*l de de*onstrat*vos contábe*s de empresas classifica**s *omo
solve*tes e que pert*ncessem ao set*r econ*mico de material bás*co. Com
i*s*,
bus*ou-se adequar a base de da*os a* ambi*nte econ*mico *o qu*l oco*reram as
insolvê*cias, ou seja, a q*anti*ade de empres*s *ue a*resentam pro*le*as na sua
saúde f*nance**a * *em inferior àquela* de boa saúde finan*eira.
*79
Ru* Américo Mathiasi Hort* et al.
* base foi composta por d*dos referentes a*s *emonstrat*vos *ontáb*is d*s
cinco a*os anteri*res ao ano em que a e*presa foi declarada ins*lven*e. De acordo
com Al*man, Giancarlo e Vare*to (1994, p. 508) * c*m Hung e *hen (2*09, p. 5297), *s
empr*sas insolven*es come*am a apre*entar caracterís*icas *u indí*ios de insolvênc*a
cerca de cinc* *nos anteriores ao *no em que ocorre efetiv*ment* a fa*ha.
Os dados sobre empresas solventes totalizaram o período de dez *nos,
fac*litando *s*im uma melhor caracteri*aç*o dessa* empres*s. Pret*n*eu-se, ta**ém:
uma adequa*ão após o a*o *005 em qu* ocorreu a muda*ça na Lei de Falências n*
*ra*il; *tilizar dados **tidos em demon*trativ*s co*tábeis *laborados de acordo
com a* nor*as in*e*naci*n*is, *eis n. 11.638/07 e 1*.941/09 e os procedimentos **
Co*itê de Pro*uncia*ent* Contábeis e, so*retud*, adequa* a ba*e de d*dos a um
perí*do *e tempo co* o a*biente e*onômico *e muit*s mu*anças e tran*for*açõe*
p*ra as empresas brasileiras (cri*e do subprime).
Das métr*cas *e avaliação al*ernativas existentes par* li*ar com o problema
do de*equilíbrio de clas*es citadas por Küc* (2*04, p. 68) e Gary (2*04, *. 9), foram
escol*id*s três (APÊNDI*E *): Ma*riz *e **nf*são (MC), M*dida * e Área sob a
curva ROC (AUC).
Para a *va*iação dos *la*sificadores, foram ***l**adas *a*idação *ru*ada e c*m
res*bstituição (B**GA-*ET* *t a*., 2004, p. 254). Tam*ém fo* ut*lizad* a técnica
da votação *ajoritár*a na combinaçã* dos classificado*es gerad*s. A t*cni*a da maioria
dos votos é um método simpl*s e eficaz de combinação (LI; JIE, 20*9, p. 43*6).
*.2 TÉCNICAS D* TRATAM*NTO DE *ANCO*
DESBALANC**DOS
A abordagem basea*a em amostras é *mplamen*e usada para resolv*r o
problema de desequilíbri* de class*. A *d*ia da amost*age* é mod*ficar a dist*ibuição
d*s *nidades de forma q*e a classe min*ritár*a seja mais bem r*prese*ta*a
*o
c*nju**o ** treinamento.
A m*neira mais simp*es para *menizar * d**equilíbrio entre instân*ias de
cada classe (neste *studo, * cl*sse de empresas solventes e a classe das empresas
insolve*t*s) em uma ba*e de *ado* é bala*c*ar *rtific*almente a distribuição *as
c*asse* *o conjunto *e dad*s. Du*s ab*rdagens padrã* são utilizadas nes*e *studo: a
remoção de exemplos *a classe maj*ritária - *n**r-samp*ing e * inclusão de exempl*s
180
**scontin***ade de empre*as b*asileiras...
d* classe minoritári* - over-sampling. Ambos os mo*elos são baseados n* r*tirada ou
na colocação de *ados na base de f*rma r*ndô*ica.
3.3 A *STRATÉGIA PARA * PREDIÇÃO DE EMPRESAS
INSO**E*T*S
*escreve-se, n*sta s***eção, *m método *onstru*do esp*cifi*amen*e *ara
* pre*ição de insolvência em uma base de d**os desbalanceada, compos** por
variáveis originadas de demonstrativos contábeis de *m*res*s brasileiras.
Vale recordar q*e um dos prin*ipai* modos *ar* *ratar u*a base de *ado*
des*alanceada *as*ia-se em proced**entos randômic*s de diminuição dos dados da
clas*e majorit*ria (under-sampling), no i*crem*n** *os dados da classe m*noritár*a,
por mei* da replic*çã* randômi*a com *eposição (over-s*mpling), e na combinação
d*ssas d*as estr*té*ia*. Nesse *aso, n*o exis*e geração de nova* instância*, p*is o
balanceamento * *eito com a simples manipulação da bas* *e da*os origina*.
O m**elo desenvol*ido, apl**ado neste trabalho, busca d*m**uir este
c*mponente *stocástic*, v*sando a utilização dos dados da classe *inoritária de forma
mais *nten*a ou redu***nte, p*is se busca maior nível de ace*to nes*a classe, como é
intuitivamente dese*ável em problemas de p*evisão d* *nsolvência, e a decom*osição
da c*as*e majoritária de forma a torná-la de dim*n**o "aceita*elment*" m**s pr*xima
à clas*e min*ritária. É importante ressal*ar que a o*ed**nc*a a ess*s dois objetivos
acarretam, c*mo caracte**st*ca adici*nal, a diminuiç*o da al*at*riedade n* o*tenção
do *a*a*ceamento. A*sim, esse modelo é denom**ado *emi-Determinístic Ense*bl*
Strategy f** I*bal**c*d Dat* (SEI*). A form* d*finida para considera* os dois
obj*tiv*s *onjuntam*nte f*i utilizar u* comitê de *lassificad*re* (ensemble classifier)
(TSAI; W*, 2008; NAN**; LUMINI, 2009). Em *e*mos práticos, um comitê *e
classi**cadores é compo*to por vários classificadores ind*viduais, c*da um g**ado com
d*dos/par*metr*s **ferentes, que dev*m ser *ons*der*dos no proce*s* d* indução,
baseando-s* em alg**a *stratégia de combinação dos resultados individua*s. Os
modelo* mai* representativ*s *e co**tê *e *lassi*icadores são os algoritmo* de bagging
(BREIMAN, 1996) e boost*ng (SCH*PIRE, 1990). *o **g*ri*m* d* bagging, é gerado
um dete**ina*o núme*o de clas*ificadore* indivi*uais p*r meio de bases *btidas
com o mesmo número *e instân*ias da *ase original gera*as por meio da *scolh* d*s
inst*nci** *ia distribuiç*o uniforme c*m reposiçã* da base original. No a*goritmo
*e boosti*g, busca-se aumenta* o nível de predição, foca*do-s* no desenvolv*ment*
181
Rui Am*ri*o M*th*asi Horta et al.
de classific*dores i*dividuais *ue tenha* um enfoque m*ior na class*ficação das
instância* que se apresent*m com *aior dific*ldade de disc*imina*ão.
Um *rocedimen** de com*tê apresen*a, natura*me**e, uma fa*ilidade *e
impleme*tação dos objet**os para cada classe, c**o descrita anteriormente. No cas*
da ne*essida*e de redu*dância *as **stânc*as minoritár*a*, te*-se * *acilidade de
utilizá-*as *m cada ba*e para a g*ração dos *lassific*dores individuais que compõem
o comitê. No *aso das i**tâncias majoritá*ia*, em que se pr*tende pa*ticion*r ou
d*compor em subco*jun**s, pod*m-se *is*ribu** suas instâncias em su*-*ases
diferentes para g*rar os cla*sifi**dore* que for**m o c*mitê. Dessa forma, a partiçã*
*ão prejudica nem * rep*ese*tat*vidade dos dados da classe majoritá*ia, que deve*
*ompor pelo m*nos um* *as* de ***os do comit*, nem * dimensão da base, po*s *ma
estratégia de com**ê li*a bem **m base* de dado* m*nos completas, por não basea* *
dec*são em somente um dos classificado**s g*ra*os. Alé* diss*, o* pa**metros pa*a
d*ter*inar t*ma*hos mínim*s *a base *os cl*ssificadores ** comitê se*vem
para
ev*tar a utili*ação de bases *om dime*sões consider*da* ina*equadas.
Vale ressalta* que essa est**tégia para bal***eamento baseada em *omitê
pe*mite o uso de um **ocedimen*o *e *e*eção de *a*acterí*t*cas de *orma
*iferenciada, desc*ita **is adi*nte.
O modelo f*i inicialmente aplicado na pr*dição de insolvência de *mp*esas
listadas na Bov*spa sem d**tinç** de setor por H*rta; De Lim* e Bo*ges (200*, p. 208).
Conside*a-se, *nici**m*nte, a com*osi*ão do *onjunto de tre*namento:
(1)
Str = Strm StrM ,
ou sej*, o co*junt* formad* pela união das i*stâncias *a clas*e minoritá*ia
(Strm) e da **as*e *ajor*tária (Str*), s*ndo #( *trM) > #( S*rm), onde #(*) s*g*ifica
*úme*o de instâncias do conj*nto.
Os co*juntos de treiname*to gerado* p*ra a obtenção dos **ass*fic*dores
indi*idu*is ser*o balanceados co* instâncias em cada classe, a sab*r, majoritária e
mi*oritária. Para que se obtenham conjuntos de trein*ment* com as c*racterístic*s
p*evistas, adota-se co*o valo* mínimo para o número de **stân*ias por classe o
*eguinte valor:
#( *t*m), #( StrM)/), (2)
*82
Descontinuida*e de *mpresas brasilei*as...
onde * o número de classificadores bases (*ndividuais) u***os no comi*ê de *lassificad*res
e o operador max (*,*) c*l**la o mai*r valo* *ntre os a*gumentos. *uant* *aio* o valor
de , *ai* *róximo o algoritmo se *orna *o algoritmo de baggin*, ou seja, é *m algor*tmo
*ue cria amostras rep**id*mente a partir de um conjunto de dados de acordo com
uma distribui*ão uniforme de *istribuição. A expecta*iva do algo*itmo é que pouco*
cla*si*icadores ba*es sejam necessários para a geração de um comit* de classificadores de
qualidade a**quada. A seguir, **res**ta-*e o pseu*ocódigo do comit* de *lass**ic*dores.
Figu*a 1 - Algor**mo SE*D
Ps*u*o*ódi*o: c*mitê d* cl*s*ifica*ores para base de dados desbalanc*ada (SEID)
Iní*io
Defi*a o número de *lassific*dores bases n_cb
Defina o núme*o d* instâncias pa*a ca*a cl*s*e n_**
% constru*ão *os n_cb cla*sifica*ores bas*
para i=1, n_cb
% cl*sse mino*itária
%
complet*r,
quando
necess*rio,
ap**cando
um
pr*cesso
d* bootstrap
na
classe minor*t*r*a
para j = #(*trm)+1, nic
fim
j-ésima i**tâ*cia ob*id* a*licando bootstr*p n* amost** Strm
% *la*se majo*itária
para * = 1, #( St**)/ n_cb
fim
j-*sima instânc*a obt*da d* *trM sem repo*ição
%
com*l*ta*,
quando
n*ce*s*rio,
apl*cando
um
*rocess*
de b*otstra*
na
classe majoritária
para j = #( StrM)/ *_cb+1, *_ic
fim
j-*si*a *nstânc*a *bt*da ap*icand* bootstrap na amostra StrM
fim
Treine os n_cb classificadore* b*se
% cla*sificaç*o de novas in*tâncias
*plique técnica de votação maj**itária *ara cla*sificar os ***o* de test*
Fim.
Fonte: os *utore*.
183
Rui Améric* Mathiasi *orta et al.
3.4 SELEÇÃO D* ATRIBUTO*
A*esar de parecer "óbvia" ou "s*mpre neces*ária", * seleção de atributos
é um* opçã* met*do*ógica de fundamental importância em apre*dizagem
** má*uina, sendo frequ*nteme*te realiza*a como *m* etapa de pré-
proces*amen*o. O objet*vo pr*nci*al da seleção d* *tri*ut*s, pa*a Meis*l (197*,
p. 1*2), é a *bten*ão de um espaço de cara**erísticas com baixa d*mensi*nali*ade,
retenç** de infor*açõ*s **fici*ntes, aume*t* d* *epara*ilid**e na *unç*o espaço,
por exem*lo, em dife*entes c*t*gorias, *emo*endo efe*t*s em razão da* *aracterí*t*ca*
rui*osas, e comparabilidade dos r*c*rs*s e*tre os *xemplos *a me*ma categoria. Os
p*incipai* objetiv*s da seleção d* atri*ut*s para previsão d* insolvência, segu**o
Pi*amuthu (2006, p. 489), são o desen*ol**ment* de modelos compactos, o us* e
re**namento do modelo *e classificação *u predição par* avaliação * a iden*ifica**o
de índic*s financeiros r*lev*ntes.
Nest* tra**lho, **ram utilizadas du*s abord*gen* de busca (*ITTEN;
*R*NK; HALL, ****, p. 293): seleção f*rward e s*leçã* a*eatóri*. *á para * avaliaç*o
do subconjunto de atributos selecionad*s, utili*ou-s* a a**r*agem encapsulada
(w*a*per). Para Somol et al. (2005, p. 997), a abordagem wrapper deve ser preferida
qu*ndo s* t*a*a de est**o* sobre in*ol*ên*i* d* empresas.
3.* A ESTRATÉGIA DE PREDIÇÃO DE INSOLVÊNCIA COM
SELE*ÃO DE AT*I*UTOS
Apresenta-se, nesta *eção, uma técn*ca p**a *eleção de a*rib*tos a ser acop**da
ao *o*elo de predição d**e*v*lvid* (SEID), completando * propo*ta deste trab*lho.
* ideia é c*nsider*r a aplicaç*o dos mé*odos de s*leção de forma individualiza*a nas
*ases que comp*e* * comit*, configurando o m*delo propost* Semi-Determinístic
Ense*ble *trategy for Imba*anc*d D*ta with a*tribute Select*on (SEIDwS). * fl*xog*ama
do mod*lo *ar* a predição de insolvên*ia c*m est*atégia *e *eleção de
atributos
é apre*entado n*s F*uxog*a*as 1 e 2 a seguir. D*ve-se ress*ltar que o comi*ê de
c*assificadores é com*osto por três s*b-bases, ness* caso, a s*ber, SB1, SB2 e SB3.
1*4
Desco*tinu*dade de e*pr*sas b*asileiras...
Fl***grama 1 - Proc*dimen*os para *e chegar ao* resultados após os b*lanc*amen**s e a
seleç*o de a*ributos da base de dados *rig*nal
BO
Ger*d*s pelo *EID
*B*
SB*
SB3
Se*eção de
atributo*
A*
Validação cruzad*
HC1
HC*
HC3
BO
Resubstituição
P*E1
P*E2
PRE3
Fo*te: os a*tores.
F*uxograma 2 - *rocedime*to de clas*ificação Com *eid ou Seidws
BO
SEID ou SEID*S
Valida*ão *ruzada
HC
BO
R*substituição
* RE
Fonte: os autores.
Nota: Legenda das siglas nos F*uxogramas 2.1 e 2.2 - BO: Base de *ados original; SB: Subase g*rados pelo
Seid; AD: Classi*icador árvore *e *ecisão; HC: Mo*e**s gerados após a seleç*o de atri*utos e a aplicaçã*
d* cla**ificado*; PRE: *esultad*s encontrados após *estar os mode*os *era**s na *a*e *e ***os original.
N**a: As si*l*s na Fluxogram* 2.2 são a* mesm*s da Fluxog*a*a 2.*, *n*retanto, a*ui, é
sinte*i*a*o o pr*cess*me*to da e*tratég*a apr**ent*da.
185
Rui Américo **t*ia** Horta et al.
4 *ES*LTA**S
N**ta seção, são apr*sentados os r*s*lt*dos d*s a*lic*ções à base de da*os
aq*i cons*r*í*a. E*ta base se re*ere a variáveis obtidas em de*ons*rativos contá*eis
d* empresas do setor de material bá*ico.
4.1 *OMPARAÇ*O D* BASE DE DADOS ORIGINAL *OM *
BASE BALANCEADA
Na T*bela 1 é feita *ma comparação da base o*iginal *o* os resultados
encon*rados após a a*l*caçã* da estratégia *EIDwS u**liza*do * modelo wr*pp*r.
Tab*l* 1 - Co*pa*ação dos result*d*s
B**e origin** SEI**S
Classe
MC
F
AU*
MC
F
AUC
I
*
0,8**
0,895
10
*,983
0,9*1
3
0
3
2
*
0,938
0,895
0,957
0,981
177
178
Fonte: os autores.
Pela Tabela 1, a pa*ti* da a***ise da *C, F e AUC, evidencia-s* q** aque*a*
e*presas *las*ificada* como insolventes (I) obtiv*r*m, *om * aplicação *o SEIDwS, um
resultado **m ef*c*ente, *om 10 *as 10 in*tânci*s classificadas corretam*n*e, um val*r de
F *em conside*áve*, 0,98*, e um *UC que pode se* co*sid*rado bem e*icient*, 0,9*1.
Dessa forma, c*nclui-se que o ba*anceamento c** a seleção de a*ributos e
um comitê de classificadores (SEIDwS) melh**am a capacidade de caracter*zaçã* da*
empresas *lassificadas c*mo insolven*es, os resulta*os da MC, F e AUC evidenciam
ess*s ganhos (*ASE O*IGINAL x SEIDwS).
4.2 COMP*RAÇÃO DAS VARI**EIS SELEC*ONA**S NAS
BASES **LANCEADAS ANTES E P*S CRISE SUBP*IME
N*sta s*bseç*o, é aplicada a *s*r*tég*a SE*DwS desenvolv*da par* a predição
*e insolvênci*s em emp*esas. Na prática, * aplic**ão completa do SEIDwS é obt**a
1*6
Desco*ti*uidad* de empresas brasilei*as...
com o uso da votação ma*ori*ária (*I; JIE, 20*9) em relação aos resultad*s d*s
*o*elos das sub-bases obtidas na defini*ão da *n*tância q*e est* sendo avaliada.
Dess* forma, a* sub-bases passam a rep*e*en**r um comi*ê de classifi*adores,
conforme **scrito anteriorm**t*.
Das 23 variáveis totais, sete foram sel*cionadas: E*CpOT, EOAT, GAF,
M*, EBITDA, MO, TERFI* no *eríodo ent*e os anos *e 1996 * 2006 (HOR*A
** al., 2*12). Já no período qu* com*reende os anos 2**7 até 2012, as
variáveis
sel*cio***as for*m: *OCpOT, GAF, LI, LC e MB. O* resul*ados o*tidos são
mostrados na Tabela 2, apresentada a seguir.
Tabela 2 - Resultad** referentes às var*á*eis seleci*nadas de acordo *om *s pe*ío*os pré e
pós c*ise subpr*me
Períod* de 1996 a 20*6
Per*odo de 2007 a 201*
EOCpOT
EOCpOT
GAF
GAF
MB
MB
EBTIDA
LI
MO
LC
EO*T
-
T*RFI*
-
Fonte: os autores.
P*los **sul*ados apresent*dos n* Tabela 2 ficou d*monst*ada a mudança de
algumas **s var*áveis *eleciona*as no* dois pe*íodos estudados, foram s**ecion*das
duas variáveis r*ferent*s à li*uidez e *ão foram selecionadas algumas da* variáveis
representa*iva* do de*empenho op*racio*al das entidades, com i*so, pode-se
entend** da p***alência do financeiro em detrimento *o operacional *pós a crise
*o sub*rime.
5 ANÁLISES DOS *ESULTAD*S, CONCLUSÕ*S *
FUT*ROS E*TUDOS
Observou-se *o e*tudo q*e prevaleceram aquel*s variá*eis or*gi*adas d*
Balanço Patrim*n*al, a ún*ca exceç*o foi a *ariável MB; iss* evidenc** a im*ortância
patrimonia* e financeira des*as entida**s dur*nte o pe**odo *stu*ado, 2007 a 2**2
(Tabel* 2).
187
Rui **érico *athia** Horta et a*.
Dessas variá*eis selec*onad**, três se repe*e* (E*CpOT, *AF e *B); nos
dois períodos *ob análise eviden*ia-se a importân*ia da adoção contínua de uma
política de endi*i*amento em níveis prude*t*s e gerenciáveis, em especial quanto
a* seu e*d**ida*e*t* on*ro*o (E*CpOT e GAF).
Já a presenç* d* va*iáve* MB pode mostrar a importância permane*te *o grau
de eficiência da gerência da *mpresa p**a usar materi**s e mão de ob*a *o proce*so de
produ*ão, r*fletindo a r*lação en*re pr**os, quantid*de pro*uzida e c*stos.
*o q*e se r*fere *o período a*tes cris* *ubpri*e (1996-2006), m*is dua* v*riáveis
relacionad*s a*s aspec*os ope*acionais est*v*m presentes, MO e E**ID* (T*bela 2), o
*ue *o*e levar à *onclusão de que o dese*penho operacio**l (*end** e *ust*) perde*
relevâ**ia após a crise de 2007 pa*a o financeir* (li*uidez). Essas duas variávei* represen*am
* eficiência *pe*aci*nal ain*a não d*storcida pelos cálcu*os d* fin*nciame*to e i*postos.
As o*tras **riáve*s selec*onada* (LI e L*) r*presenta* a i*portân*ia da li*uidez
para essas empresas nesse per*o*o (p**-c*ise su*prime). G*nhou impo*tância uma melhor
adequação da estrutu*a financeir* n*s *nti*ades, sobr*tudo a da **quidez, evidenciando
a necessi*ade de ada*ta*ões às mud*nças ocorridas no *mb*e*te *conômico em *ue
**e*avam (queda no ní*el de liqu*dez no mer*ado). Adquire relevâ*c*a a relaç** com
*s credo*es em d*tr*m**to ao *os gestores (operacional) ** per*odo anterior, pois ta*s
*re*ores estã* interessa*o* em financiar as necessid*des de u* negócio sucedido, que
funcionará c*mo esp*rado e terão os seus recu*s*s co* retorno garant*dos.
Ao mesmo tempo, *les têm qu* consid**ar as possív*is co*se*uências negati*as
da inadimplênci* e *a liqu*dação. No período pós-cri*e subprime, a *roteção de que di*p*e*
os credo**s se centra n* crédito de curto praz* concedido pa*a um* empres* financi*r suas
ope*açõ*s.Os*r*doresc*ns*deramosa*ivosatuaisq*epo*emserpront*me*teconve*t*do*em
caixa, na *uposição d* q*e eles representariam um* segur*nça *medi*ta contra a inadimplên**a.
* presença da variáve* L* na *el*ção de atributos da b*se d* dados pós-crise
subprime *v*dencia cada vez *a*s a imp*rtância da necessária capacidade da *ntidad*
de p*gar suas obrigações de **r** pr*zo valendo-se de suas di**onibi*idad*s
em
cai*a, ban*os ou *plic*ções no me*cado financei*o de curtíssimo prazo, obje*i*ando
que tais empre*as obtenham sucesso *a sua co*tinui*ade.
C*mp*rando as *ar*á*eis seleci*na*a*, apresent*d*s *a Tabela 2, pode-se
inferir que h*uve um* *ecessid*de de mudança de es**a*égia gere**i*l r*levante
após a crise do *ub*rim* nas empresas *r**i*eiras do set** de mate*i*l básico; saiu do
foco o*eracional e foi para o *oc* fi*anceiro *u d* cre*or. Ter *m* relação "*ais
a*igável" com os cred*res ganh*u d*mensão nesse *er*odo, cui*ar da capa*idade
d* pagame*to g*nhou mais importância p*ra aquela* empresas qu* obtiveram
o
188
D*sconti*u**ade de e*presas brasi***ra*...
su*esso da contin*ida*e. T*is fatores continuam *endo preponderante* nas empresas
a*ua*mente, talv*z até com mais *reponderânc*a e* relação ao per*od* estuda**.
E*tapesquisaapresent*ueaplic*uum*e**ratégiaparasolucionarumpr*ble*ap*uco
estuda*o em modelagens par* descontinuidade d* empresas - o desequilíb*io entre as classes
de e*pr*sas *lassificadas como solvent*s e as empresas classificada* como insolvente*. *a
maioria das pe***isas existentes a amostra estudada é *ma paired sample, ou seja, composta com
n*mero igual de emp*esas solven*es * ins*lventes. Essa *aridade entre as cla*ses de empresa*
*epres*n** mal a realida** d* am**ente econômico, di*torcendo a utilid*d* da a*ost*a *,
comp*ovadamente, prioriz*n*o a cl*ss*fic*ção corre*a somente pa*a as empres*s solventes.
Durant* alg*m tempo os d*dos con*ábeis, no Bras*l, for*m *ratados com
des*onfi*nça, de modo que pesquisas e c*n*lusões como as pre*entes servem para *eitera* a
conven****ia *aquel* *tili*ação pa*a a análise d* evolução econô*ic* d* empre*as em *o*so
País *onfirm*n*o, assim, * valor pr*di*ivo p*es*nte na in*ormaçã* contábil-fi*anceira.
Out** c*ntri*uição que pode *er *o*side*ada de**e trabalho *iz respe*to
*o uso exclusi*o *e d*d*s origi*ados *e d*monstrat*vos contábei* *e
***resas
*ertence*t** * somente um set*r econômico, com *sso, fica bem ma*s rel*ciona*o
os mot*vos da ins*l*ê*cia *a*uela* *mpresas, *ão h*vendo influên**as de vari*veis
mais significativas para emp*esas de outros setores econômi*o*.
Esta pesquisa evidenci*u m**anças gerada* p*lo novo ambiente
macroeconômico das empresas (crise do subp*ime) pertenc*n*es ao setor e**nômico
*e mat*r**l básico, durante o *eríodo *studado, ger*n*o ne*essidad*s d* readequações
ge*enc*a**, p*eva****ndo as questõe* d* liquidez visand* manter a sua cont*nu*dade.
P*s*íveis extensões *o presente es*ud* *everiam contempl*r a inclusão d* novas
técnic*s de comitês de c*assificações e a *nclusão de va*iáve*s *ualit*tivas na ba*e de dados.
Em ambos *s casos deve re**lt*r mel*or capacidade pr*ditiva dos modelos de p**visão.
Co* isso, o S*IDwS de*erá melhorar, ainda mais, a c*assificaç*o d*quelas empresas *ue
po*em vir a se tornarem insolv*n*es, ***m de dis*rimi*ar a importância de*sa* variáveis.
R*F*RÊNCIAS
ALTMAN, E. I.; BAIDYA, T. *. N.; DIAS, L. M. R. *re**sã* d* problemas
fina*c*ir*s *m empresas. Revista de Administraçã* de Empresa*, v. 19, p. 17-
2*, *an./mar. 1979.
A*TMA*, E. I. Fin*ncial *atios, discriminant analy*is and t*e p*ediction of
corpor*te bankruptcy. Jo*rnal of Finance, v. 23, n. 4, p. 58*-609, 1968.
ALTMAN, E. I.; GIANCARLO, *.; V*RETTO, F. Corporate d*s*re*s diag*osis:
comparisons using l*near discriminant *n*lysi* a*d neural netwo*ks (the It*lian
ex*erien*e). *ournal of Bank*ng & *i*ance, *. 18, n. 3, p. 505-529, 19*4.
18*
Rui Américo *athias* H*rta et a*.
AL*MA*, E. I.; HALDEMA*, R. *.; NARAY*N*N, *. Zeta *naly*is: a ne*
mode* to identify ban*rupt*y ri*k of corp*rat*ons. Jo*rnal *f Ba**ing and
Fin*n*e, v. 1, p. 29-54, 1977.
ATIYA, A. F. B*nkruptcy pre**ction for *redit risk *si*g neural netwo*k: * surv*y an*
new results. IE*E transact*o*s on ne*ral **two*ks, v. 12, n. 4, p. 929-935, 2001.
BALC**N, S.; OOGHE, H. *5 *ea*s of studies *n business f*il*r*: *n over*iew
o* the classical *tatistical methodologies *nd their *elated problems. The British
Acco*nti*g Review, v. 38, n. 1, p. 63-*3, 2006.
**AGA **TO, U. et al. Is cross-validation b*tter *han resubstitution fo* r*nking
gene*? Bioi*fo*matics, v. *0, *. 2, p. 253-258, 2*04.
*REIM*N, L. Ba*g**g pred**tors. Machine Learni*g, v. 2*, p. 123-140, 1996.
CA*BAS, S.; CABUK, A.; KILIC, S. B. P*ediction of commer*ial bank fa*lure *ia
m*ltiv*riate st*tisti*al a*aly*is of financi*l str**ture: *he t*rkish cas*. Jou**al of
Operational Rese*rch, v. 166, p. 5*8-54*, 2005.
C*AWL*, N. *. et *l. Synthetic *inority ov*r-samp*ing te*hnique. Journal of
Art*fic*al Intelligence Researc*, v. 1*, p. 321-*57, *002.
CHA*LA, N. V.; J*PKO*IC*, *.; KOLCZ, A. Editorial: special *ssue o* l*a*ning
from im*alanced datasets. S*GKDD Expl*rations, v. 6, *. 1, p. 1-6, 2**4.
COST*, F. M. da; *EIS, J. S. do*; TE*XEIRA, A. M. *. Repec, *ra***ia, DF, v. 6,
*. 2, p. 141-*53, abr./jun. 20*2.
CROUHY, M. G.; JARROW, R. A.; T*RNBUL*, S. M. The subpr*me credit
cr*sis of 07: working paper. New Yor*: Cor*ell University 2*08.
ELIZABE*SKY, R. Um mod*lo matemátic* para decisão n* banc*
comerci*l. 1976. Dissertação (Me*tra*o em Enge*haria de Produção)-
Universidade de Sã* Paulo, São Paulo, 1976.
F**ER*, L. P. *t al. A*álise de dados: modelagem multiv*riada p*r* tomada de
d*cisões. Rio de Janeiro: Else*i*r, 2009.
GARY M. W. Mining with rarity: * uni*yin* framew*rk. Sigkdd E*plorat*ons, v.
*, *. 1, p. 7-19, 2004.
GESTEL, *. V.; BAESE*S, B.; MARTEN*, D. From lin*a* to **n-linea* *er*el ba*ed
class*fiers for bankruptcy p*e*iction. *eurocomputing, v. 73, *. 2955-2970, 2010.
190
Descontinui*ad* de empresas brasileiras...
GNED*NKO, B. V. A teoria *a probabili*ad*. Rio de *aneiro: Ciência Moderna, 200*.
GUJA*ATI, *. N. Ec*nometria bá*ica. 4. ed. Rio de Janeiro: Elsevier, 20*6.
HORT*, R. A. M.; DE *IMA B. S. L. *.; B*RGES *. C. H. A semi-determi*ist** ens*mble
*trategy for *mb*lan*ed datasets (SEID) a*plied to bank*up*cy predicti*n. In: *ata *ining
IX: data minig, prot*ction, *etecti*n *nd *ther security technologi*s. WIT *r*nsa*ti*ns on
in*orma*ion and commun*cation technologies, v. 40, p. **5-213, 2**8.
H*RTA, R. A. *. et al. Previsão de insolvência com seleç*o de at*ib*tos no
set*r de material *ásico: um* metodol*g*a p*ra *alanceamento d* bases d* *ados.
In: CON*RESS* *ACIONAL DE ADMIN*S*RAÇÃO * *IÊNCIAS
CONTÁ*EIS, 3., 2012, R*o de *aneiro. A*ais... Rio de Janeiro, 2012.
HORTA, R. A. *. Uma metodologia d* mine*ação ** da*os pa** a
p*evisão de insol*ência de empre*as bra*il*iras de ca**ta* abert*. 2*10. *52
p. *ese (Doutorado em Engenharia Civil)-Univer*idade Fed*ral do *io d* Janei*o,
R*o de Janeiro, 2*10.
HUANG, *. L.; CHEN M. C.; WANG, C. J. Cred*t scorin* with a dat*
min*ng approa*h b*sed on support vector m*chines. Expert System* wi*h
Applica*ions, v. 33, p. 847-856, 2007.
HU*G, C.; CH*N, J.-H. A s*lect**e ensemble *ased on expected pro*abili*ies for
bankruptcy p*ed**tion. Exper* systems with *pplications, v. **, p. 5297-53*9, 2009.
IUDÍ*IBUS, S. de. Análise de balanços. 10. ed. São *aulo: At*as, 2009.
JAPKOWICZ, N.; *TEP*EN, S. The c*ass imbalance pro*lem: a s*stematic
*tudy. Intel*i*ent Dat* A*alys**, v. 6, p. 429-449, 2002.
KANI*Z, *. C. Como prever *alências. São Pa*lo: M* G*aw-Hi*l do Brasil, 19*8.
KÜCK, H. Baye*ian f*rmulations o* mult*ple ins*ance learning with
applications t* g*n*ral obje*t rec*g*i**on. 2*04. M**ter\s *hesis. Uni**rsity
of Britis* Colu*bia, Vancouve*, 2004.
LI, H.; JIE, S. Majority *oting combination o* multiple c*se-ba*ed reasoning for financi*l
d*stre*s **edicti*n. E**er* Systems with Applica*io*s, v. 36, p. 4363-4*73, 2009.
MARTIN, D. Early w*r**ng of bank fa*lur*: a *ogit regression *ppro*ch. Jour*al
of Ban*ing and Fina*ce, v. 1, p. 249-276, 19*7.
*A**AS, A. *. C*ntri*uição às té*nic*s de a*álise *inance*r*: um mod*l*
de *once*são de crédito. 1978. 82 p. *rabalho de Con*lusão de C*rso (Gr*duaç*o
em Econom*a e Admin*st***ão)-Univers*dade *e Sã* P*ulo, São Pau*o, **78.
191
192
Rui A*éri*o Mathiasi Horta *t al.
MEISEL, W. S. Computer-oriented ap*roaches t* **tt*rn recogni*ion. Ne*
York: Academic P**ss, 1978.
MI*, S.-H.; LEE, J.; H*N, I. *ybrid ge*etic *lg*r*thms a** support *ector
*a*hines fo* ban*ruptcy predi*ti*n. Expert Syst*m* w*th Applications, v. 31,
p. 652-660, Oc*. 200*.
MOR*Z*NI, J. F.; OLINQUEVITC*, J. L.; HEIN, N. Sel*ção de ín*ices
na anális* d* b*lan*os: u*a *p*icação da técnica esta*ístic* \*C*\. R*vista
***tabili*ade e Finanças U**, São Paulo, v. *, *. 41, **i*/ago. 2006.
MOURA, G. D. *e et al. Re**ção entre a**vos intangív*is e gove*nança corporativa
em compa*h*as abertas *istadas na B*&FBove*pa. Revi*t* de Con*abili*ade e
C*ntroladoria, Cu*itiba, v. *, n. 1, p. 120-1*8, *a*./abr. 2013.
N**N*, L.; LU*I*I, *. *n ex**rimental compari**n of *nsemb*e of
classif*er* for *an**uptcy prediction *nd credit sc*ring. E*pert Systems with
Applications, *. 36, p. 30**-3033, m*r. 20*9.
OHLSON, J. A. F*na*cial ratios and the probabi*istic prediction of ba*krup*cy.
J*urna* of A*counting *esearch, v. 1*, p. 109-131, 1980.
P*NM*N, S. Análise das demonstraçõe* finan*ei*as e security valuat*on.
Rio de Janeiro: Elsevie*, 201*.
PINDYCK, *. S.; RUBINFELD, D. *. *conometria: modelos e p**visões. 4. *d.
Rio d* Janeiro: *ls*vier, 2004.
**RAMUTHU, S. On prep*oces**ng data for financia* credit risk evalua*ion.
Expert S***ems with Applicati*n*, v. 30, p. 489-49*, 2006.
RAVI, V. et al. *avi. So*t computing s*stem for bank perf*rm*nce *redition.
App*ied Sof* *omputing, v. 8, p. 305-315, jan. 2008.
SANVICENTE, A. *.; MINARDI, A. *. A. F. **entificação de indi*adores con*ábeis
*igni*icativos p*ra pre*isão *e concordata de empresas. 2005. *isp*n*vel: <http://
*ww.risktech.br/artigos/arti*os técnicos/in*ex.html>. Acess* em: 23 o*t. 2012.
S*HA***E, R. E. The strength of weak learnability. Mac*ine Le*rni*g, v. 5, p.
1*7-227, 1*90.
SHIN, K.-S.; LE*, Y.-J.; KIM, H.-J. An application of support vect*r machin*s in b*nkruptcy
*r**iction model. Expert *ystems with *pplication*, v. 2*, *. 12*-135, j**. 20*5.
SILV* BRITO, G. A.; ASSA* NETO, A.; CO*RAR, L. J. Sis*emas de *lassificação
de ris*o de créd*t*: uma aplicaç*o a c*m*anhias abertas no Brasi*. *evi*ta
Contabili*ad* & F*nanças USP, São Paulo, v. 20, n. 5*, p. 28-43, *et./dez. 2009.
Desco**inuidade d* empresas *rasi*eiras...
S*MOL, P. et al. Filter *ersus wrapper-based feature selectio* *or cre*it scoring.
Int*rnational Jour**l *f Intelligent Systems, v. 20, n. 10, p. 985-99*, 2005.
*UN, J. et al. Predic*in* fi*an*ial distres* and corp*ra** failure: a review fro*
*he *t*te-of-*he-art definitions, modeling, *a*plin*, and fe*turing app*oaches.
*no*ledge-Bas*d Systems, v. 57, p. 41-56, Feb. 2*14.
T*AI, C. F. Feature selection in bank*u*tcy prediction. Kno*ledg*-Bas*d
*yst*ms, v. 22, p. 120-127, 2009.
TSAI, *. F.; W* J. W. Us*ng neu*al net*ork *ns*mbles **r *ank*uptcy prediction *nd
c*edit scori*g. Expe*t Syst*ms with applications, v. 34, p. 2639-2649, *ay 20*8.
UN**ED STAT*S OF AMERICA. Th* financia* cris*s inquiry report. *ubl*c
Affairs, p. 15, 20**.
WEISS, G. M.; MCC*RTHY, K.; BI*I, Z. cost-sensitive learning vs. sampl**g:
which is best for *andling u*balanced classes wit* un*qual erro* costs?
P*ocee**ngs of the 20*7 Inte*national Conf*re*c* *n Data *ini*g, New
York, *. 3*-*1, 2007.
WEST, R. *. * *actor an*lytic app*oach to bank condition. Journal of Banking
and Fi*ance, v. 9, p. 253-266, Jun. 1985.
WITTEN, *. *.; FRA*K, E.; *ALL, M. A. Data mi*ing: practical machine
learning tools and *echniques. In: KAUFMANN, M. Ser*es in data
manage*ent systems. 3. ed. 2011.
WOLK, H. I.; DODD, J. L.; ROZY*KI, J. J. Acc*untin* theory: co*c**t*al issue*
in * poli*ical a*d econ*m*c en*ironme*t. 8. ed. London: Sage Publi*ations, 201*.
Y*H, C.-C.; CHI, D.-J.; LIN, Y.-R. Goi*g-co*cern predi*tion usin* hybrid *andom
fo*ests and ro*gh set ap*ro*ch. *n*or*ation Sci*nces, v. 254, *. 98-10*, J*n. 2014.
Z*OU, L. *erfo*mance of c**porate b*nkruptcy *rediction models on
imbalanced *ataset: The e*fect *f sampli*g methods. Knowledge-Ba*ed
**stems, v. *1, p. 16-*5, Mar. 20*3.
AGRADECIMEN*OS
Agrade*emos à Fap*mig pelo apo*o concedido à p*sq*isa APQ 0091*/12.
193
R*i Améric* *ath*asi Hort* et a*.
APÊNDICE A - VARI*VE*S CO*TÁB*** C**ETADAS
L*qu*dez corrente (LC), Liquide* se*a (LS), Liquid*z Imediata (LI),
Liquidez G*ral (LG), End*vidamento O*eroso sobre Patrimônio Líquid* (E*P*),
E**ividamento Total sobre o *atrim*nio Líquid* (EOAT), Endivida*ento
O*eroso *e Cu*to Pr*zo sobre Ativo To*al (EOCpOT), Grau de Alavancagem
Financeira (GAF), Imobilizado dos Rec*r*o* Permanen*es (IMCP), Margem
Br*ta (MB), Ma*g*m Op*racional (MO), *argem Líquida (ML), *iro do Ativo
(GA), Rent*bi**d*de d* Ati*o Oper*cional (ROA), Retorno do* Acio*istas (ROE),
Retorno do I*vest*men*o Total (ROI), Term*met*o F*nanceiro (TERFIN), Modelo
Dupont Adap*a*o (RTA), Lucro antes d*s j*ros, *mpo*tos (EBIT), Luc*o antes *os
juro*, impostos, *epr**ia*ões/exau*tão e a*o*ti*ação (EBIT**), Pra** médio de
estocagem ** matéria-prima (PM*), P*azo Médio de Fabricação (*MF), Prazo
*é*io de venda (PM*).
*94
Desc*n*inui*ad* d* empre*a* brasileiras...
APÊND*CE B - MÉ*RICAS D* *VALIAÇÃO
1 MATRIZ *E CON*USÃO
Os dife*entes tipos de *rr*s e *certos realiz*dos por um *lassificador p*dem
*er si**et***dos *m um* ma*riz de *onfusã*. N* Ta*e*a 3, é mostrada *ma matriz
de confusão para um p*oblema *ue po*sui duas clas*es ro*ul*da* como p*s*tiv*
*
negat*va.
Ta*ela * - Mat*iz de c*nfusão para *uas classes de probl*m*s
Predição Posi**va A
Prediçã* Negativa B
Cla*s* Positiva
Verdadeiro *ositivo (TP)
Fa*so Nega*ivo (FN)
Classe Negativa
Falso Po*itivo (*P)
Ve*dade*ro Negativo (TN)
Font*: os autores.
2 ÁREA SOB A *URVA ROC (AUC)
Por d*finição, uma *u*va R*C é um grá*ico *idimensio*al em que o eix*
ho*izontal representa a taxa de erro *a c*asse n**ativa (1-Spec) e no e*xo vertical o*
val*res de sensi*ividad*. * desempenho de um c*assificador é med*do p*la *re* **b
a curva ROC (AUC).
Pontos na diagonal *epre*enta* classif*c*dores aleatór*os, d* aco*do co*
a *rob*b***dade a prio*i de cada *la*se. Acima (abaixo) d* d**gonal enco*tram-se
c*as*ificadores com desempen*o melhor (pior) que o cl*ssif*cado* *leatóri*.
3 ME*IDA F
Para se *nt*nder a métrica M*dida F é imp***ante conhecer a *efinição
d* sua comp**içã*. Recall e Precisi** ou pr*cis*o *ão dua* ***ricas amplamente
usadas em aplicaç*es onde * dete*ç*o bem suce*ida de uma classe * consid*rada
mais significativa do que outras cla*s**. U*a definição f*rmal des*as mé**icas
é
a*resen*ada a seguir:
195
R** Améric* M*t*iasi Horta *t al.
Precisão, p = (T* + FP) FP
Rec*ll, r = TP / (TP + *P)
A precisão d*term*na * fração de registr** que r*al*ente acaba* sendo
positi*os no g*upo que o cla*sificador declarou como classe positiva. Quanto
m**or * precisão, menor o númer* de erro* positivos *o *rupo que o *lassificador
d*cl*r*u co*o clas*e positiva. O reca*l m*de a *ração de exemp*os positivos previst**
corretam*nte pelo c*assifica**r. Classific*dores com v*lores *ltos de recal* têm
poucos exe*plos positivos mal classific*dos com* * classe neg*tiva. Na ve*da*e, o
valor de recall é equivalente à *axa de po**tiv*s ver*adeiros.
O desafi* do* algori*mos d* classifica*ão é elabor*r um modelo que
maximize t*nto a prec*são quanto o re**ll.
A métrica e*tr* precisão e recall é concedida pelas fór*ulas a seguir:
Medida F =
2 x r*call x pr*cisã* =
2xTP
recalll + precisão
*xTP + F + F P N
C*mo c*tar este art*go
HORTA, *ui Am*r*co Mathiasi *t al. Descontinu*dade de empresa* b***ilei*as do
setor de material básic*: no pe*íodo co*preendid* pr* e pós a cri*e do subprime.
RA*E, Revista de Administraçã*, Conta*i*idade e Econ*m*a, Joaç*ba: E*. Un*esc,
v. 14, n. 1, p. 1*1-196, jan./abr. 201*. Disponível em: <http://*dit*ra.unoesc.*du.br/
i*dex.ph*/race>. Acesso e*: dia/mês/an*.
Ho*ta,*. A. M., Al*es, F. J. dos *., Borg*s, C. C. H., & Rod*i**es, A. (2015).
Des*ontinuida*e de emp*esas brasilei*as do setor de material bás*co: no período
comp*eendido pré e pós * crise do subprim*. *ACE, R*vista de Administração,
Conta*ilidad* e Eco*omi*, 14(1), 171-196.Re*uperado em dia/*ê*/ano, de h*tp://
ed*tora.unoesc.edu.br/in*ex.ph*/race
196