Hortonworks CEO Rob Bearden: Pas op voor de Hadoop fragmentatie

Hortonworks CEO Rob Bearden heeft een simpele missie: Groeien de Hadoop en big data markten met een zware vleugje open source en vervolgens de financiële gezondheid van het bedrijf zullen volgen.

Te midden van de huidige Hadoop ontwikkelingen — is er een bedrijf niet de lancering van een verdeling met enkele toegevoegde waarde software? — Hortonworks opvalt. Waarom? Hortonworks draait over zijn gehele distributie naar de Apache open source project.

Hortonworks, die in wezen werd uitgebroed met het team binnen Yahoo dat Hadoop in de eerste plaats populair, is ook op een beetje een traan dit jaar. Het bedrijf is uit te breiden in Europa, afronding van het management team met nieuwe medewerkers en heeft een Hadoop distributie voor Windows als een beta gemaakt.

Ik haalde Bearden, de voormalige chief operating officer van zowel SpringSource en JBoss en Oracle executive, om te winkelen praten vorige week. Hier is een blik op de hoogtepunten uit mijn praatje

Op de Hortonworks strategie, Bearden opgemerkt dat het algemene idee was om Hadoop’s functies te ontwikkelen en hen te dragen aan Apache. Het bedrijf bouwt haar Hadoop distributie en bij te dragen dat 100 procent open source. “We zijn direct de bouw van in de kern romp, tot product van het pakket, het doen van QA en loslaten,” zei hij. “Het is niet een open kern model.” Wanneer Bearden verwijst naar de kern te openen dat hij verwijst naar een trend in Hadoop distributie waar er open source componenten, maar met de eigen software als toegevoegde waarde. Deze open kern methode wordt gebruikt door Pivotal / EMC, Cloudera en MapR.

Waarom zou niet Hortonworks open kern gaan? Bearden zei dat het doel van Hortonworks is om de totale markt taart voor Hadoop groeien. Trouwens, Hortonworks ‘revenue model draait om ondersteuning. Door het maken van de distributie van 100 procent open source, het dient als een keer te proberen voordat je steunprogramma kopen. “Ik denk dat het belangrijk dat we de functie markt op schaal snel,” zei Bearden. Concreet wil hij een open enterprise data platform dat de big data taart zal groeien creëren.

Is Bearden zich zorgen over het breken van Hadoop? In een woord ja. Bearden opgemerkt dat IBM en EMC zou het niet erg versplintering Hadoop. Waarom? Grote IT-spelers moeten zo veel controle van de nieuwe datasets (denk big data) mogelijk te grijpen. Door grijpen meer data onder beheer, kan enterprise reuzen meer hardware, software en diensten te verkopen. “Het is belangrijk om breuk te houden van deze ruimte,” zei Bearden. “De manier om die breuk te stoppen is aan bedrijven wat ze willen op een open platform te geven.” Bearden merkte op dat de laatste Hadoop distributies niet zijn gericht op Hadoop direct breken, maar versplintering is “een neveneffect van wat ze willen doen.

Karakteriseren van de nieuwe Hadoop distributies is vergelijkbaar met het kiezen van een deel van een mashup. Er zijn mixen van de open software en proprietary. Uiteindelijk deze verknipte Hadoop distributies zou kunnen leiden tot lock-in omdat ze niet 100 procent geopend. Over het geheel genomen Bearden zei Hadoop zal worden gebroken tot op zekere hoogte.

Op support overeenkomsten, Bearden gezegd dat er een aanzienlijke meerderheid van de technologische leiders die ondersteuning bij hun Hadoop distributie willen, ook al Hortonworks distro is op Apache.

Wat Hadoop wel en niet kan doen. Bearden zei Hadoop is solide als een onderneming platform en opslag laag voor ongestructureerde data. “Het is betrouwbaar, voorspelbaar en stabiel,” zei hij. “Er is echte betrouwbaarheid vandaag voor opslag verwerking op schaal.” Er moet meer instrumenten voor complexe data management, maar Bearden verwacht dat de functionaliteit om het komende jaar aankomt. Waar Hadoop visies verschillen is real-time transactieverwerking. Bearden’s nemen is dat de real time verwerking is vele jaren weg als ooit. “Ik wil benadrukken ‘of nooit,’ ‘zei hij. “We willen niet zien Hadoop zijn opslag, verwerking van ongestructureerde data en real-time.” Andere bedrijven achter distributies, met name Cloudera, zie real-time verwerking zo belangrijk. “Waarom opnieuw het wiel,” vraagt ​​Bearden. Hoewel het proberen om upend de wil van IBM, Teradata, Oracle en andere data warehousing spelers kan interessant zijn, is het onwaarschijnlijk dat een kleine bak kan concurreren. “Ik zou liever mijn distro goedgekeurd en naadloos geïntegreerd in hun omgeving,” zei Bearden. Bijvoorbeeld, Hortonworks en Teradata hebben een nauwe samenwerking integratie. “Het is niet een Lego-uitwisseling en connectors,” zei Bearden van Hortonworks ‘samenwerking met Teradata. “We kunnen het beheer van gegevens blijkt bij elke later.

Internationale expansie. Hortonworks onlangs uitgebreid naar Europa, Midden-Oosten en Afrika en bouwt haar infrastructuur. Andere internationale beweegt langzaam komen. “We moeten het eerst goed te krijgen in Noord-Amerika,” zei Bearden. “We zullen het juist dicht bij huis te krijgen en dan het opzetten van de infrastructuur om de zon te volgen.

LinkedIn onthult haar nieuwe blogging platform

Is dit de leeftijd van Big OLAP?

DataRobot streeft naar laaghangend fruit van data science automatiseren

Het maken van de zaak voor Big Data, Big data: Hoe de revolutie kan uit te spelen

EMC’s Pivotal Initiative lanceert: Nu komt de uitvoering deel; EMC lanceert Hadoop distributie, is gericht op Cloudera; Intel bakken Apache Hadoop in silicium voor big data, maakt gebruik van de veiligheid; Waarom hardware reuzen Hadoop distro blij

MapR oprichter John Schroeder treden naar beneden, COO te vervangen

Social Enterprise; LinkedIn onthult haar nieuwe blogging platform; Big Data Analytics, Is dit de leeftijd van Big OLAP;? Big Data Analytics; DataRobot gericht op low-opknoping fruit van de gegevens wetenschap te automatiseren; Big Data Analytics; MapR oprichter John Schroeder treden naar beneden, COO te vervangen