/ - Diff - D-Net - D-Net project tracking tool

     package eu.dnetlib.data.hadoop.utils;
     import java.util.Map.Entry;
     import java.util.Set;
     import org.apache.hadoop.hbase.HColumnDescriptor;
     import org.apache.hadoop.hbase.HTableDescriptor;
     import com.google.common.base.Function;
     import com.google.common.base.Predicate;
     import eu.dnetlib.data.hadoop.HadoopJob;
     import eu.dnetlib.data.hadoop.config.ClusterName;
     import eu.dnetlib.data.hadoop.rmi.HadoopJobDescriptor;
     import eu.dnetlib.data.hadoop.rmi.HadoopServiceException;
     import org.apache.commons.logging.Log;
     import org.apache.commons.logging.LogFactory;
     public class HadoopUtils {
     	public static Function<HTableDescriptor, String> tableName() {
     		return new Function<HTableDescriptor, String>() {
     	private static final Log log = LogFactory.getLog(HadoopUtils.class);
     			@Override
     			public String apply(final HTableDescriptor d) {
     				return d.getNameAsString();
     	public static java.util.function.Function<HadoopJob, HadoopJobDescriptor> asDescriptor() {
     		return d -> {
     			try {
     				return d.asDescriptor();
     			} catch (HadoopServiceException e) {
     				log.warn(e);
     				return null;
+    			}
     		};
+    	}
     	public static Function<HColumnDescriptor, String> columnName() {
     		return new Function<HColumnDescriptor, String>() {
     			@Override
     			public String apply(final HColumnDescriptor d) {
     				return d.getNameAsString();
+    			}
     		};
+    	}
     	public static Predicate<String> columnPredicate(final Set<String> cols) {
     		return new HadoopUtils().getSetPredicate(cols);
+    	}
     	public SetPredicate getSetPredicate(final Set<String> set) {
     		return new SetPredicate(set);
+    	}
     	class SetPredicate implements Predicate<String> {
     		private final Set<String> set;
     		public SetPredicate(final Set<String> set) {
     			this.set = set;
+    		}
     		@Override
     		public boolean apply(final String s) {
     			return !set.contains(s);
+    		}
+    	}
     	public static Function<Entry<String, HadoopJob>, HadoopJobDescriptor> hadoopJobDescriptor() {
     		return new Function<Entry<String, HadoopJob>, HadoopJobDescriptor>() {
     			@Override
     			public HadoopJobDescriptor apply(final Entry<String, HadoopJob> e) {
     				try {
     					return e.getValue().asDescriptor();
     				} catch (HadoopServiceException e1) {
     					return null;
+    				}
+    			}
     		};
+    	}
     	public static Predicate<HadoopJob> filterByCluster(final ClusterName clusterName) {
     		return new Predicate<HadoopJob>() {
     			@Override
     			public boolean apply(final HadoopJob job) {
     				return job.getClusterName().equals(clusterName);
+    			}
     		};
+    	}
+    }

     import java.util.Date;
     import java.util.List;
     import java.util.Map;
     import java.util.Map.Entry;
     import java.util.Objects;
     import java.util.stream.Collectors;
     import org.apache.commons.logging.Log;
     import org.apache.commons.logging.LogFactory;
     import org.springframework.beans.factory.annotation.Required;
     import com.google.common.collect.BiMap;
     import com.google.common.collect.HashBiMap;
     import com.google.common.collect.Iterables;
     import com.google.common.collect.Lists;
     import com.google.common.collect.Maps;
     import eu.dnetlib.data.hadoop.HadoopJob.Status;
     import eu.dnetlib.data.hadoop.config.ClusterName;
     import eu.dnetlib.data.hadoop.rmi.HadoopJobDescriptor;
     import eu.dnetlib.data.hadoop.rmi.HadoopServiceException;
     import eu.dnetlib.data.hadoop.utils.HadoopUtils;
     import org.apache.commons.logging.Log;
     import org.apache.commons.logging.LogFactory;
     import org.springframework.beans.factory.annotation.Required;
     public class JobRegistry {
-...
+    	}
     	public List<HadoopJobDescriptor> listJobs(ClusterName clusterName) {
     		Map<String, HadoopJob> filtered = Maps.filterValues(jobs, HadoopUtils.filterByCluster(clusterName));
     		return Lists.newArrayList(Iterables.transform(filtered.entrySet(), HadoopUtils.hadoopJobDescriptor()));
     		return jobs.values().stream()
     				.filter(j -> clusterName.equals(j.getClusterName()))
     				.map(HadoopUtils.asDescriptor())
     				.filter(Objects::nonNull)
     				.collect(Collectors.toList());
+    	}
     	@Required

     import java.io.IOException;
     import java.net.URI;
     import java.util.List;
     import java.util.Map;
     import java.util.*;
     import java.util.Map.Entry;
     import java.util.NavigableMap;
     import java.util.Set;
     import java.util.stream.Collectors;
     import com.google.common.base.Function;
     import com.google.common.collect.Iterables;
     import com.google.common.collect.Lists;
     import com.google.common.collect.Maps;
     import com.google.common.collect.Sets;
-...
     import eu.dnetlib.data.hadoop.rmi.hbase.HBaseRowDescriptor;
     import eu.dnetlib.data.hadoop.rmi.hbase.schema.HBaseTableDescriptor;
     import eu.dnetlib.data.hadoop.rmi.hbase.schema.HBaseTableRegionInfo;
     import eu.dnetlib.data.hadoop.utils.HadoopUtils;
     import org.apache.commons.lang.StringUtils;
     import org.apache.commons.logging.Log;
     import org.apache.commons.logging.LogFactory;
-...
     	public List<String> listTables(final ClusterName clusterName) throws IOException, HadoopServiceException {
     		final HBaseAdmin admin = getHBaseAdmin(clusterName);
     		return Lists.newArrayList(Iterables.transform(Lists.newArrayList(admin.listTables()), HadoopUtils.tableName()));
     		return Arrays.asList(admin.listTables())
     				.stream()
     				.map(HTableDescriptor::getNameAsString)
     				.collect(Collectors.toList());
+    	}
     	private HBaseAdmin getHBaseAdmin(final ClusterName clusterName) throws HadoopServiceException {
-...
     		final Set<String> columns = Sets.newHashSet();
     		for (HColumnDescriptor hColDesc : Lists.newArrayList(desc.getColumnFamilies())) {
     		for (HColumnDescriptor hColDesc : Arrays.asList(desc.getColumnFamilies())) {
     			columns.add(hColDesc.getNameAsString());
+    		}
-...
     	public List<String> describeTable(final ClusterName clusterName, final String table) throws IOException, HadoopServiceException {
     		final HBaseAdmin admin = getHBaseAdmin(clusterName);
     		final HTableDescriptor desc = admin.getTableDescriptor(table.getBytes());
     		return Lists.newArrayList(Iterables.transform(desc.getFamilies(), new Function<HColumnDescriptor, String>() {
     			@Override
     			public String apply(final HColumnDescriptor desc) {
     				return desc.getNameAsString();
+    			}
     		}));
     		return desc.getFamilies().stream()
     				.map(d -> d.getNameAsString())
     				.collect(Collectors.toList());
+    	}
     	public void truncateTable(final ClusterName clusterName, final String table) throws IOException, HadoopServiceException {
-...
     			createTable(clusterName, table, columns);
     		} else {
     			final HTableDescriptor desc = admin.getTableDescriptor(Bytes.toBytes(table));
     			final Set<String> foundColumns = Sets.newHashSet(Iterables.transform(Lists.newArrayList(desc.getColumnFamilies()), HadoopUtils.columnName()));
     			final Set<String> foundColumns = desc.getFamilies().stream()
     					.map(d -> d.getNameAsString())
     					.collect(Collectors.toCollection(HashSet::new));
     			log.info("ensuring columns on table " + table + ": " + columns);
     			final List<String> missingColumns = Lists.newArrayList(Iterables.filter(columns, HadoopUtils.columnPredicate(foundColumns)));
     			final Collection<String> missingColumns = Sets.difference(columns, foundColumns);
     			if (!missingColumns.isEmpty()) {
     				if (admin.isTableEnabled(table)) {

     			if (status == Status.SUCCEEDED) {
     				// TODO set some content to return to the blackboard msg.
     				log.info(String.format("start looking for oozie job(%s) output values: %s", getHadoopId(), workflowActions));
     				final Properties report = getReport(getOozieClient(), getHadoopId(), workflowActions);
     				if (report != null) {
     					final Map<String, String> map = Maps.newHashMap();
     					report.forEach((k, v) -> map.put(k.toString(), v.toString()));
     					log.info("found oozie job report, size: " + map.size());
     					getCallback().done(map);
     				} else {
     					log.warn("cannot find oozie job report!");
     					getCallback().done(new HashMap<>());
+    				}
                 } else {
-...
     	private static Properties getReport(final OozieClient oozieClient, final String oozieJobId, final Set<String> workflowActions) throws OozieClientException, IOException {
     		WorkflowJob oozieJob = oozieClient.getJobInfo(oozieJobId);
     		for (WorkflowAction currentAction : oozieJob.getActions()) {
     			log.debug(String.format("looking for workflo actions to report, current: '%s'", currentAction.getName()));
     			log.info(String.format("looking for workflow actions to report, current: '%s'", currentAction.getName()));
     			if (workflowActions.contains(currentAction.getName())) {
     				log.info(String.format("found workflow action %s", currentAction.getName()));
     				if (ACTION_TYPE_SUBWORKFLOW.equals(currentAction.getType())) {
     					log.info(String.format("looking for sub-workflow actions external id: %s", currentAction.getExternalId()));
     					Properties subworkflowProperties = getReport(oozieClient, currentAction.getExternalId(), workflowActions);
     					if (subworkflowProperties != null) {
     						return subworkflowProperties;
-...
     				} else if (StringUtils.isNotBlank(currentAction.getData())) {
     					Properties properties = new Properties();
     					properties.load(IOUtils.toInputStream(currentAction.getData()));
     					log.info(String.format("found workflow action(%s) properties size %s", currentAction.getName(), properties.values().size()));
     					return properties;
+    				}
     			} else {
     				log.info(String.format("cannot find workflow action(%s) properties", currentAction.getName()));
+    			}
+    		}
     		return null;
+    	}

     			@Override
     			public void done(final Map<String, String> properties) {
     				bbJob.getParameters().putAll(properties);
     				log.info(jobName + " completed successfully");
     				log.info(String.format("%s completed successfully, returning %s output params", jobName, properties.size()));
     				handler.done(bbJob);
     				decrementRunningJobs(jobName);
+    			}

     	@Override
     	public void execute(final BlackboardServerHandler handler, final BlackboardJob job) {
     		executor.execute(new Runnable() {
     			@Override
     			public void run() {
     				try {
     					handler.ongoing(job);
     					executeAsync(handler, job);
     				} catch (final Throwable e) {
     					log.error(ExceptionUtils.getFullStackTrace(e));
     					handler.failed(job, e);
+    				}
     		executor.execute(() -> {
     			try {
     				handler.ongoing(job);
     				executeAsync(handler, job);
     			} catch (final Throwable e) {
     				log.error(ExceptionUtils.getFullStackTrace(e));
     				handler.failed(job, e);
+    			}
     		});
+    	}

Project

General

Profile

D-Net

Revision 48800

Added by Claudio Atzori over 6 years ago