Michael Stonebraker, pionnier de PostgreSQL, promet de perturber une fois de plus la base de donn√©es - ūüŹÜ Managed Server

BLOG

27 décembre 2023

Michael Stonebraker, pionnier de PostgreSQL, promet de perturber à nouveau la base de données

Le lauréat du prix Turing, dont la recherche et les startups ouvrent la voie depuis cinq décennies, déclare à The Register qu'il a encore plus en réserve

Le lauréat du prix Turing, dont les recherches et les startups ont façonné l'industrie pendant cinq décennies, a déclaré à The Reg qu'il avait encore beaucoup à faire.

Et si nous construisions le syst√®me d‚Äôexploitation au-dessus de la base de donn√©es au lieu de l‚Äôinverse ?

Cela ressemble à une idée d’étudiant après une microdose de trop, mais ce n’est pas le cas. C'est une idée sérieuse de la part de quelqu'un qui a déjà révolutionné l'industrie informatique et dont l'influence s'est étendue aux produits bien connus de Microsoft et d'Oracle.

Michael Briseur de pierres

Célébrant cette année son 80ème anniversaire, Michael Stonebraker poursuit son travail dans la recherche de bases de données, mais son impact sur l'industrie a été consolidé avec PostgreSQL., le système de base de données relationnelle open source qui, pour la première fois, est devenu le choix le plus populaire parmi les développeurs cette année, selon l'enquête Stack Overflow 2023. En plus d'être un SGBD open source populaire, les fournisseurs, y compris les géants du cloud, , CockroachDB et YugabyteDB proposent des services de base de données avec une interface compatible PostgreSQL.

 

Les premiers travaux influents de Stonebraker ont commencé avec Ingres, le premier système de base de données relationnelle, qui est devenu son sujet de recherche après avoir été nommé professeur adjoint à l'UC Berkeley en 1971.

S'adressant à The Register, il déclare :

Ma th√®se de doctorat portait sur un aspect des cha√ģnes de Markov, et j'ai r√©alis√© qu'elle n'avait aucune valeur pratique. Je suis all√© √† Berkeley et j'avais cinq ans pour apporter ma contribution et obtenir la titularisation. Je savais que ce ne serait pas mon sujet de th√®se. Ensuite, Eugene Wong, un autre membre du corps professoral de Berkeley, a d√©clar√© : ¬ę Pourquoi ne regardons-nous pas les bases de donn√©es ? ¬Ľ

Les deux hommes ont lu une proposition r√©cente sur les bases de donn√©es relationnelles d'Edgar Codd, un chercheur d'IBM, intitul√©e ¬ęUn mod√®le de donn√©es relationnel pour les grandes bases de donn√©es partag√©es. ¬Ľ

Stonebraker et Wong ont trouvé l'idée de l'anglais élégante et simple.

La question évidente était d’essayer de construire un système de base de données relationnelle. Eugene et moi n'avions aucune expérience dans la création de logiciels système, mais, en tant qu'universitaires, nous avons pensé : essayons et voyons ce qui se passe. Ainsi, sans aucune expérience, nous avons commencé à créer Ingres. Et cela m’a valu mon poste de professeur.

Ingres avait des concurrents. Le System R d'IBM a été le premier à démontrer que l'approche relationnelle pouvait fournir des performances opérationnelles en matière de transactions et a été le premier à implémenter le SQL désormais omniprésent. Oracle a lancé son système relationnel à la fin des années 70. Ingres a également été confronté à un problème de plate-forme.

De nombreux visiteurs à Berkeley nous ont demandé qui était le plus gros utilisateur d’Ingres. Ensuite, l'Arizona State University a voulu l'utiliser pour une base de données de 35.000 XNUMX dossiers d'étudiants, mais elle n'a pas pu ignorer le fait qu'elle devait se procurer un système d'exploitation qui n'était pas pris en charge par ces gars des Bell Labs, qui était Unix.

Le ciblage d'Ingres sur les systèmes de milieu de gamme, dans lesquels Unix venait d'émerger, signifiait également qu'il ne prenait pas en charge COBOL, le langage dominant pour l'informatique d'entreprise à l'époque. La seule solution était de créer une entreprise.

dit Stonebraker.

Il a fondé Relational Technology pour commercialiser Ingres. Elle a ensuite été rebaptisée Ingres Corporation, puis rachetée par ASK Corporation en 1990, qui à son tour a été rachetée par Computer Associates en 1994. Un autre membre de l'équipe Berkeley Ingres, Robert Epstein, a fondé Sybase, qui pendant une décennie a été le deuxième derrière Oracle dans le domaine. marché des bases de données relationnelles. En 1992, sa gamme de produits a été concédée sous licence à Microsoft, qui l'a utilisée pour les premières versions de SQL Server.

Mais Stonebraker a reconnu que le code commercial d'Ingres √©tait bien en avance sur le projet de recherche open source (d'autres chercheurs pouvaient obtenir le code pour une somme modique couvrant la bande n√©cessaire √† son stockage et les frais de port). Son √©quipe a donc d√©cid√© de jeter le code. une falaise et recommencer. Qu‚Äôy a-t-il apr√®s Ingres ? √Čvidemment Postgres.

Une nouvelle √®re En 1986, un document de 28 pages [PDF] ‚ÄĒ co-√©crit avec Larry Rowe ‚ÄĒ a annonc√© la conception de Postgres, comme on l'appelait alors, en d√©finissant six ambitions directrices. Parmi ceux-ci, deux se sont r√©v√©l√©s pertinents pour la long√©vit√© du syst√®me de base de donn√©es. L'une d'elles consistait √† fournir une meilleure prise en charge des objets complexes. La seconde √©tait de fournir une extensibilit√© utilisateur pour les types de donn√©es, les op√©rateurs et les m√©thodes d'acc√®s.

Stonebraker nous dit qu'il savait, gr√Ęce √† des conversations avec des clients d'Ingres, qu'√™tre extensible serait important pour le succ√®s d'une base de donn√©es √† l'avenir. ¬ę Un client m'a appel√© un jour et m'a dit : ¬ę Vous avez mal appliqu√© le timing ¬Ľ ¬Ľ, a-t-il d√©clar√©.

Le professeur de Berkeley √©tait perplexe car son √©quipe avait fait de grands efforts pour s'assurer d'appliquer correctement le calendrier julien, y compris les ann√©es bissextiles. Mais certaines obligations financi√®res sont pay√©es en 12 mois √©gaux sur une ann√©e de 360 ‚Äč‚Äčjours, ce qui n'est pas possible dans Ingres mais dans PostgreSQL, dit-il.

La motivation pour rendre la base de donn√©es extensible venait √©galement du d√©sir de prendre en charge de nouveaux types de donn√©es.. Un premier projet avec Ingres cherchait √† l'utiliser comme syst√®me d'information g√©ographique, loin de son territoire de donn√©es d'entreprise. Cela a √©t√© ¬ę arbitrairement lent et insoluble ¬Ľ, dit Stonebraker.

Cette vision a porté ses fruits au cours de la dernière décennie. Il y a dix ans, PostgreSQL a ajouté la prise en charge des documents Json, le format de fichier sur lequel sont basées les bases de données NoSQL MongoDB et Couchbase.

Stonebraker a critiqué le mouvement NoSQL dans le passé. Il raconte à The Register qu'il convergeait vers les bases de données relationnelles parce qu'elles adoptaient SQL ou des langages de type SQL et acceptaient le besoin de cohérence.

La plus grande bonne id√©e de NoSQL √©tait l'exp√©rience pr√™te √† l'emploi, car avec les bases de donn√©es SQL, vous devez cr√©er la base de donn√©es, puis d√©finir le curseur. Ils sont difficiles √† utiliser. C‚Äôest l‚Äôune des critiques les plus valables adress√©es aux bases de donn√©es SQL : l‚Äôexp√©rience pr√™te √† l‚Äôemploi est nulle. Vous devriez pouvoir l'allumer et dire : "Voici quelques donn√©es".

Les différents services disponibles pour fournir des bases de données PostgreSQL et des bases de données compatibles PostgreSQL contribuent dans une certaine mesure à résoudre ce problème, mais l'émergence du SGBD en tant que système open source populaire était un heureux accident, et avec lequel Stonebraker n'avait pas grand-chose à voir.

M√™me si le code de recherche de la base de donn√©es √©tait ‚Äď et reste ‚Äď open source, construire une soci√©t√© de bases de donn√©es autour de ce code √©tait, √† l'√©poque, impossible, comme Stonebraker l'a d√©couvert en fondant Illustra en 1992. ¬ę Lorsque nous avons obtenu un financement en capital-risque √† la fois pour Ingres et pour Postgres, les soci√©t√©s de capital-risque ne voulaient rien avoir √† faire avec l'open source, c'√©tait un ph√©nom√®ne ult√©rieur ¬Ľ, dit-il.

En 2005, Stonebraker a fond√© Vertica sur la base d'un SGBD partag√© orient√© colonnes pour l'entreposage de donn√©es, qui, selon lui, ¬ę aurait √©norm√©ment b√©n√©fici√© d'√™tre open source, mais la vitalit√© du code open source et de la communaut√© VC est un ph√©nom√®ne relativement r√©cent ¬Ľ.

¬ę Les bases de donn√©es ferm√©es ne sont pas la voie du futur ¬Ľ Illustra a connu du succ√®s pendant un certain temps. Il a finalement √©t√© vendu √† Informix pour environ 400 millions de dollars en 1996, la participation de Stonebraker √©tant √©valu√©e √† 6,5 millions de dollars, √©crivait Forbes en 1997. Stonebraker est devenu CTO de la soci√©t√© m√®re pendant quatre ans.

C'est une somme confortable, mais ce n'est que des miettes de poulet compar√©e √† la valeur nette estim√©e de Larry Ellison √† 145 milliards de dollars. Il va sans dire que Stonebraker se montre d√©daigneux √† l'√©gard d'Oracle, un autre adepte pr√©coce du mod√®le relationnel. ¬ę Ingres a toujours √©t√© techniquement meilleur et Postgres est pratiquement meilleur. C'est plus flexible et c'est open source. Et aujourd‚Äôhui, PostgreSQL est globalement comparable en termes de performances. En g√©n√©ral, les bases de donn√©es ferm√©es ne sont pas la voie de l'avenir et je pense qu'Oracle est tr√®s cher et peu flexible ¬Ľ, d√©clare Stonebraker.

Cependant, c'est Oracle qui a pris une d√©cision qui a donn√© une impulsion √† l'open source PostgreSQL. Il a achet√© MySQL open source, auquel une partie de la communaut√© ne faisait pas confiance au g√©ant du logiciel propri√©taire. Au m√™me moment o√Ļ Illustra et d'autres soci√©t√©s commercialisaient Postgres, Berkeley publiait le code de POSTGRES sous licence MIT, permettant √† d'autres d√©veloppeurs de travailler dessus.

En 1994, Andrew Yu et Jolly Chen, tous deux dipl√īm√©s de Berkeley, ont remplac√© le langage de requ√™te POSTQUEL par SQL. Le Postgres95 r√©sultant a √©t√© rendu disponible gratuitement et modifiable sous une licence plus permissive et renomm√© PostgreSQL.

Ce qui s'est finalement pass√©, c'est qu'Illustra gagnait du terrain, mais le grand coup a √©t√© lorsque ce groupe de personnes totalement ind√©pendantes que je ne connaissais m√™me pas, a r√©cup√©r√© le code open source Postgres, qui existait toujours, et l'a utilis√©, totalement sans ma connaissance. C'√©tait un merveilleux accident. Lorsque MySQL a √©t√© achet√© par Oracle, les d√©veloppeurs sont devenus m√©fiants en masse et sont pass√©s √† PostgreSQL. C'√©tait un autre heureux accident. Son succ√®s commercial est merveilleux, mais il est en grande partie d√Ľ au hasard.

ajoute Stonebraker.

Pendant ce temps, les services de bases de données se sont développés autour de PostgreSQL. Elle est devenue l'interface frontale la plus dominante pour les systèmes compatibles ou presque compatibles disponibles auprès de Google (AlloyDB et CloudSQL), Microsoft (Azure PostgreSQL), AWS (Aurora et RDS), CockcroachDB, YugabyteDB, EDB et Avien.

Le monde entier migre vers le cloud, et Google, Amazon et Microsoft misent tous sur la compatibilité PostgreSQL. Je pense que c'est une excellente idée. CockroachDB est compatible avec PostgreSQL. Vous pouvez prendre une application PostgreSQL et la déposer sur CockroachDB. PostgreSQL n'a pas de fonctionnalités de base de données distribuées, contrairement à YugabyteDB et CockroachDB.

L'influence de Stonebraker s'étend également au portefeuille de son rival Oracle. Sa base de données fédérée Mariposa est devenue la base de Cohera, une société de bases de données rachetée par PeopleSoft en 2001, avant de devenir partie intégrante d'Oracle en 2004. En 2014, Stonebraker a été reconnu pour l'influence de son travail sur Ingres et Posgres avec le Turing Award, ce qui a valu à Google 1 million de dollars dans le processus.

Bien que bon nombre de ses idées soient si largement utilisées dans l’industrie des bases de données, qui, selon Gartner, valait 91 milliards de dollars en 2022, Stonebraker se montre détendu à l’idée que d’autres personnes utilisent ses idées.

J’ai bien réussi financièrement. Je connaissais Ted Codd, qui était très magnanime en disant que vous devriez tous courir avec [des idées]. Vous voulez changer le monde ; chaque personne en particulier n’en est qu’une partie. J'ai toujours créé du code open source et partagé du code avec tous ceux qui le souhaitaient. Dans le processus, je me suis bien débrouillé financièrement donc oui, je n’ai aucun regret.

Mais cela ne veut pas dire qu’il est prêt à prendre sa retraite. Dans son dernier projet, Stonebraker est prêt à changer à nouveau le monde.

L'idée de DBOS, un système d'exploitation orienté base de données, est né d'une conversation avec Matei Zaharia, auteur d'Apache Spark, co-fondateur de la société d'analyse et d'apprentissage automatique Databricks et professeur agrégé à Berkeley.

Spark et Databricks g√®rent les instances Spark dans le cloud. Zaharia a expliqu√© qu'√† tout moment, Databricks g√®re souvent environ un million de sous-t√Ęches Spark pour diff√©rents utilisateurs. Il n'√©tait pas possible de r√©aliser cela avec les techniques traditionnelles de programmation du syst√®me d'exploitation : il fallait quelque chose qui puisse √©voluer. La solution √©vidente consistait √† mettre toutes les informations de planification dans une base de donn√©es. Et c'est exactement ce que les gars de Databricks ont fait : ils ont tout mis dans une base de donn√©es PostgreSQL, puis se sont plaints des performances de Postgres.

dit Stonebraker.

Jamais du genre √† craindre les d√©fis, Stonebraker pensa : ¬ę Eh bien, je peux faire mieux que √ßa. ¬Ľ

Le nouveau projet a remplac√© Linux et Kubernetes par une nouvelle pile de syst√®me d'exploitation sous-jacente √† un syst√®me de base de donn√©es, le prototype multi-nŇďuds multicŇďur, transactionnel et hautement disponible VoltDB, lanc√© par Stonebraker.

"À la base, le système d'exploitation est une application de base de données, et non l'inverse." il prétend.

Un article co-√©crit par Stonebraker et Zaharia, entre autres, explique :

Tous les √©tats du syst√®me d'exploitation doivent √™tre repr√©sent√©s uniform√©ment sous forme de tables de base de donn√©es, et les op√©rations sur cet √©tat doivent √™tre effectu√©es via des requ√™tes provenant de t√Ęches autrement sans √©tat. Cette conception facilite l'√©volutivit√© et l'√©volutivit√© du syst√®me d'exploitation sans avoir √† refactoriser l'ensemble du syst√®me, √† inspecter et √† corriger l'√©tat du syst√®me, √† mettre √† jour les composants sans temps d'arr√™t, √† g√©rer les d√©cisions √† l'aide de l'apprentissage automatique et √† mettre en Ňďuvre des fonctionnalit√©s de s√©curit√© sophistiqu√©es.

Qu'elle réussisse ou non, l'idée d'une application de système d'exploitation en tant que base de données ne sera probablement pas la dernière de Stonebraker. Après avoir eu 80 ans en octobre, il déclare à The Register qu'il n'a pas l'intention de ralentir.

Vous avez des doutes ? Vous ne savez pas par o√Ļ commencer ? Contactez-nous !

Nous avons toutes les réponses à vos questions pour vous aider à faire le bon choix.

Discute avec nous

Discutez directement avec notre support avant-vente.

0256569681

Contactez-nous par téléphone pendant les heures de bureau 9h30 - 19h30

Contactez-nous en ligne

Ouvrez une demande directement dans l'espace contact.

INFORMATIONS

Managed Server Srl est un acteur italien leader dans la fourniture de solutions syst√®me GNU/Linux avanc√©es orient√©es vers la haute performance. Avec un mod√®le d'abonnement peu co√Ľteux et pr√©visible, nous garantissons que nos clients ont acc√®s √† des technologies avanc√©es en mati√®re d'h√©bergement, de serveurs d√©di√©s et de services cloud. En plus de cela, nous proposons des conseils syst√®me sur les syst√®mes Linux et une maintenance sp√©cialis√©e en SGBD, s√©curit√© informatique, Cloud et bien plus encore. Nous nous distinguons par notre expertise dans l'h√©bergement de CMS Open Source de premier plan tels que WordPress, WooCommerce, Drupal, Prestashop, Joomla, OpenCart et Magento, soutenus par un service d'assistance et de conseil de haut niveau adapt√© aux administrations publiques, aux PME et √† toutes tailles.

Red Hat, Inc. d√©tient les droits de Red Hat¬ģ, RHEL¬ģ, RedHat Linux¬ģ et CentOS¬ģ ; AlmaLinux‚ĄĘ est une marque commerciale d'AlmaLinux OS Foundation ; Rocky Linux¬ģ est une marque d√©pos√©e de la Rocky Linux Foundation ; SUSE¬ģ est une marque d√©pos√©e de SUSE LLC ; Canonical Ltd. d√©tient les droits sur Ubuntu¬ģ ; Software in the Public Interest, Inc. d√©tient les droits sur Debian¬ģ ; Linus Torvalds d√©tient les droits sur Linux¬ģ ; FreeBSD¬ģ est une marque d√©pos√©e de la FreeBSD Foundation ; NetBSD¬ģ est une marque d√©pos√©e de la Fondation NetBSD ; OpenBSD¬ģ est une marque d√©pos√©e de Theo de Raadt. Oracle Corporation d√©tient les droits sur Oracle¬ģ, MySQL¬ģ et MyRocks¬ģ ; Percona¬ģ est une marque d√©pos√©e de Percona LLC ; MariaDB¬ģ est une marque d√©pos√©e de MariaDB Corporation Ab ; REDIS¬ģ est une marque d√©pos√©e de Redis Labs Ltd. F5 Networks, Inc. d√©tient les droits sur NGINX¬ģ et NGINX Plus¬ģ ; Varnish¬ģ est une marque d√©pos√©e de Varnish Software AB. Adobe Inc. d√©tient les droits sur Magento¬ģ ; PrestaShop¬ģ est une marque d√©pos√©e de PrestaShop SA ; OpenCart¬ģ est une marque d√©pos√©e d'OpenCart Limited. Automattic Inc. d√©tient les droits sur WordPress¬ģ, WooCommerce¬ģ et JetPack¬ģ ; Open Source Matters, Inc. d√©tient les droits sur Joomla¬ģ ; Dries Buytaert d√©tient les droits sur Drupal¬ģ. Amazon Web Services, Inc. d√©tient les droits sur AWS¬ģ ; Google LLC d√©tient les droits sur Google Cloud‚ĄĘ et Chrome‚ĄĘ ; Facebook, Inc. d√©tient les droits sur Facebook¬ģ ; Microsoft Corporation d√©tient les droits sur Microsoft¬ģ, Azure¬ģ et Internet Explorer¬ģ ; La Fondation Mozilla d√©tient les droits sur Firefox¬ģ. Apache¬ģ est une marque d√©pos√©e de The Apache Software Foundation ; PHP¬ģ est une marque d√©pos√©e du groupe PHP. CloudFlare¬ģ est une marque d√©pos√©e de Cloudflare, Inc. ; NETSCOUT¬ģ est une marque d√©pos√©e de NETSCOUT Systems Inc. ; ElasticSearch¬ģ, LogStash¬ģ et Kibana¬ģ sont des marques d√©pos√©es d'Elastic NV. Ce site n'est affili√©, sponsoris√© ou autrement associ√© √† aucune des entit√©s mentionn√©es ci-dessus et ne repr√©sente aucune de ces entit√©s de quelque mani√®re que ce soit. Tous les droits sur les marques et noms de produits mentionn√©s sont la propri√©t√© de leurs titulaires respectifs des droits d'auteur. Toutes les autres marques mentionn√©es appartiennent √† leurs titulaires. MANAGED SERVER¬ģ est une marque d√©pos√©e au niveau europ√©en par MANAGED SERVER SRL Via Enzo Ferrari, 9 62012 Civitanova Marche (MC) Italie.

Retour en haut de page