content top

Optimizing Hadoop for MapReduce

Optimizing Hadoop for MapReduce

Finally, the “Optimizing Hadoop for MapReduce” book I’ve been working on for the past months has been published and is now available in full version.

 

You can buy the book directly from the Packt Publishing website.

=========================================================================================

Finalement, le livre “Optimizing Hadoop for MapReduce” sur lequel je travaille depuis plusieurs mois a été publié et est maintenant disponible en version finale.

Vous pouvez commander le livre directement sur le site de l’éditeur Packt Publishing.

 

RavenDB 2.x beginner's Guide

Optimizing Hadoop for MapReduce

 

Optimizing Hadoop for MapReduce Cover
Read More

Packt’s $5 eBook Bonanza is back!

Packt’s $5 eBook Bonanza is back!

 

Following on from the success of last year’s festive offer, the publisher will be celebrating the holiday season with an even bigger $5 Bonanza.

 

$5 ebook Bonanza1

 

Read More

Hadoop et MapReduce : HDFS

Hadoop et MapReduce : HDFS

Dans l’article précédent j’ai brièvement présenté le concept de HDFS (Hadoop Distributed Filesystem). Dans cet article nous allons le présenter un peu plus en détail.

Dans ce deuxième article de la série, nous reviendrons sur le concept déjà introduit des namenode et datanode. Puis nous introduirons un élément important, le secondary namenode.

Read More

Hadoop et MapReduce : introduction

Hadoop et MapReduce : introduction

Cet article sera le premier d’une serie qui présentent la mise en oeuvre de ce système ainsi que ses capacités adapté à de grands volumes de données (Big Data). Dans cette une introduction je vais expliquer les principes de Hadoop ainsi que son utilité. Dans la suite des articles on se focalisera sur l’aspect pragmatique de ce framework par l’élaboration d’un exemple, dont le but sera de traiter un grand volume de données. De même, dans les prochains articles, on analysera la configuration et comment le mettre en place.

Read More

The Dew Review – RavenDB 2.x Beginner’s Guide

The Dew Review – RavenDB 2.x Beginner’s Guide

Alvin Ashcraft, a Microsoft Visual C# MVP, husband, father, .NET developer and geek, with 18 years of software development experience in the Healthcare, Financial and Manufacturing industries primarily using Microsoft tools, has just finished reading the RavenDB Beginner’s Guide book:

 

By , October 5, 2013

I just finished reading Packt Publishing’s RavenDB 2.x Beginner’s Guide by Khaled Tannir. I haven’t used RavenDB in a project before, so when I was asked to review the book, I jumped at the opportunity. NoSQL in general, and RavenDB in particular, is something I have meaning to start learning.

Read More

Parallel Apriori algorithm for frequent pattern mining

Parallel Apriori algorithm for frequent pattern mining

Abstract

Apriori is a frequent pattern mining algorithm for discovering association rules. It is one of the most well-known algorithms for discovering frequent patterns along with FP-Growth algorithm. However, as a result of the current advances in the area of storage of very large databases and the tremendous growth in number of transactions, sequential Apriori becomes a bottleneck because of the long running time of the algorithm. In this paper, our goal is to develop a new parallel version of Apriori that aims to reduce the overall running time of the algorithm. Although Apriori is not known to be highly parallelizable, several attempts have been made to parallelize it in various ways, either by using parallel I/O hardware to optimize database scans or by distributing the workload on multiple processors. However, many of the parallel approaches suffer from noticeable latencies in synchronizing results being collected from each individual processor after a parallel iteration terminates. Our approach focuses on trying to maximize the workload being executed in parallel and to minimize the synchronization point delays by adopting a parallel pre-computing scheme during generation of the superset. By applying our new approach, the running time of the algorithm is reduced by an order of magnitude compared to other parallel implementations of the same algorithm.

Read More

RavenDB 2.x Beginner’s Guide publié / published

RavenDB 2.x Beginner’s Guide publié / published

Finally, the RavenDB 2.x Beginner’s Guide book I’ve been working on for the past months has been published and is now available in full version.

 

You can buy the book directly from the  Packt Publishing website.

=========================================================================================

Finalement, le livre RavenDB 2.x Beginner’s Guide sur lequel je travaille depuis plusieurs mois a été publié et est maintenant disponible en version finale.

Vous pouvez commander le livre directement sur le site de l’éditeur Packt Publishing.

 

RavenDB 2.x beginner's Guide

RavenDB 2.x beginner’s Guide

 

RavenDB 2.x Beginner’s Guide Cover
Read More

RavenDB 2.x Now Available as RAW (Read as we Write)

RavenDB 2.x Now Available as RAW (Read as we Write)

Finally, the RavenDB 2.x Beginner’s Guide book I’ve been working on for the past months is available in early preview (RAW). At the time of this writing we have 9 chapters ready, and more will be released as soon as we are happy with them.

Besides getting content faster to our readers, the early preview release also allows us to receive early feedback from readers and improve chapters as we go, before the book goes to print. And I’m looking forward to getting this feedback.

See more details at  Packt Publishing website.

=========================================================================================

Finalement, le livre RavenDB 2.x Beginner’s Guide sur lequel je travaille depuis plusieurs mois est maintenant disponible en version préliminaire dite (RAW). Au moment de la rédaction de ce post 9 chapitres sont dèjà prêts, et les restants seront bientôt disponible une fois que je suis satisfait de leur contenu.

Indépendemment du fait de rendre disponible plus rapidement le contenu aux lecteurs, cette version préliminaire nous permet d’avoir un retrour de la part des lecteurs et améliorer ainsi la qualité des chapitres au fur et à mesure avant que le livre ne soit envoyé pour impression. Je suis impatient de recevoir vos commentaires et retour.

Vous pouvez obtenir plus de détails sur le site de l’éditeur Packt Publishing.

 

 

RavenDB 2.x Beginner's Guide Cover

RavenDB 2.x Beginner’s Guide Cover

Read More

Work In progress – RavenDB Beginner’s Guide Book

Work In progress – RavenDB Beginner’s Guide Book
Work in progress on the “RavenDB Beginner’s Guide” book

I recently signed a contract with Packt Publishing  for writing a “RavenDB Beginner’s Guide” book. Writing this book comes naturally after delivering many RavenDB training sessions and consultancy. The structure of the book and the actual content in it are based on actual experience of explaining RavenDB to people of different levels. Also many examples I’ll use are going to be taken from real-world scenarios.

This book is aimed at .NET developers with actual programming experience, and I’m working hard to make sure no RDBMS background will be required nor it would not confuse SQL savants. The book is designed to help RavenDB newbies to go using RavenDB from zero.

We are already in the middle of writing, the first 4 chapters  have been delivered and the work stills in progress….

—————————————————————————————————————————————————–

J’ai recemment signé un contract avec l’editeur Packt Publishing pour l’écriture d’un livre autour de RavenDB. Ce livre est bien sûr une suite naturelle aux différentes sessions de formation et de consultation effectuées en entreprise. La structure du livre et son contenu sont basés sur mon expérience actuelle dans l’explication de RavenDB à différentes personnes ayant des niveaux d’expérience différents. Egalement je me baserai sur des cas réels pour illuster les exemples du livre.

Ce livre vise les développeurs .NET ayant une expérience  dans le développement. Je m’assurerai qu’aucune connaissance préalable de base de données relationelles ne soit requise et qu’il n’y aura aucune confusion avec les systemes SQL. Ce livre est pensé comme guide de prise en main pour les débutants.

Je suis presque au milieu de cette tache et les 4 premiers chapitres ont été livrés et le travail continue…..

Read More

DMCloud : Une perspective d’architecture.

DMCloud : Une perspective d’architecture.

Présentation

L’article que je vous propose aujourd’hui est le fruit de plusieurs semaines de travail, de reflexion et de recherche. Il s’agit d’un travail de conception d’un framework permettant d’executer des algorithmes de fouille de données dans un environnement de cloud computing de manière optimale. En même temps j’ai voulu exploiter les outils existants en me basant aussi sur d’autres expériences dans ce domaine.
Dans cette vision architecturale je suis parti du principe qu’une application de fouille de données devait respecter d’abord les standards tels que CRISP-DM. Egalement, une application de fouille de données doit être vue comme une séquence de tâches utilisateurs composées par un outil orienté-service qui effectuent une ou plusieurs tâches de fouille de données. Une telle application inclue des algorithmes exécutables de fouilles de données, des utilitaires, des librairies etc..
Cette vision architecturale n’est biensûr pas exhaustive. Je présente ma solution laquelle constitue une réponse possible à cette problématique. Afin de partager mes idées et ma vision avec le plus grand nombre de personnes j’ai rédigé cet article en anglais, ce qui m’a demandé d’avantages d’efforts et merci de votre indulgence pour les fautes que vous trouverez dans le texte.
Read More
content top